当前位置：移动技术网 > IT编程>脚本编程>Python > Python正则

Python正则

2019年12月01日 | 移动技术网IT编程 | 我要评论

彩欣传媒,进击的巨人73,露西亚的情人快播

| 竖线在正则中表示或，匹配正则表达式，比如re1|re2，等于re1 或者 re2

. 点号，表示匹配除换行符以外的任意字符，

------------------------------------------------------------------------

* 星号，匹配 0 次或者多次前面出现的正则表达式

? 问号，匹配 0 次或者 1 次前面出现的正则表达式，？只对前面一个单位生效，比如， roo?n 匹配的结果只能是roon ron,意思就是问号前的o，只能出现1次或者0次

+ 加号，匹配 1 次或者多次前面出现的正则表达式

------------------------------------------------------------------------

^ (读lambada)符号，表示匹配字符串起始部分

$ 美元符号，表示匹配字符串终止部分

------------------------------------------------------------------------

{n} 大括号，匹配 n 次前面出现的正则表达式，比方说[0-9]{3},匹配三次数字

{m,n} 匹配m~n次前面出现的正则表达式，比方说[0-9]{3,5}匹配三到五次数字

------------------------------------------------------------------------

[....] 匹配来自字符集的任意单一字符，比方说[abc]，匹配来自abc的任意字符

[..x-y..] 匹配来自字符集x-y的任意单一字符，比方说[a-za-z],[0-9]，匹配来自abc的任意字符

[^...] 不匹配来自此字符集的任和字符，包括某些范围

------------------------------------------------------------------------

(*|+?{})? 用于匹配上面频繁出现/重复出现符号的非贪婪版本（*、+、?、{}）

(…) 匹配封闭的正则表达式，然后另存为子组 ([0-9]{3})?,f(oo|u)bar

------------------------------------------------------------------------

常用的记住

1、. 匹配任意除换行符“\n”外的字符；

2、*表示匹配前一个字符0次或无限次；

3、+或*后跟？表示非贪婪匹配，即尽可能少的匹配，如*？重复任意次，但尽可能少重复；

4、 .*? 表示匹配任意数量的重复，但是在能使整个匹配成功的前提下使用最少的重复。

5、 .+? 表示匹配任意数量的重复，但是在能使整个匹配成功的前提下使用最少的重复。必须有一个字符

6、 ? 问号，匹配 0 次或者 1 次前面出现的正则表达式，？只对前面一个单位生效，比如， roo?n 匹配的结果只能是roon ron,意思就是问号前的o，只能出现1次或者0次

如：a.*?b匹配最短的，以a开始，以b结束的字符串。如果把它应用于aabab的话，它会匹配aab和ab

特殊字符的含义

\d 匹配任何十进制数字，与[0-9]一致（\d 与\d 相反，不匹配任何非数值型的数字）

\w 匹配任何字母数字字符，与[a-za-z0-9_]相同（\w 与之相反）

\s 匹配任何空格字符，与[\n\t\r\v\f]相同（\s 与之相反）

\b 匹配任何单词边界（\b 与之相反）

\n 匹配已保存的子组 n（参见上面的(…))

\c 逐字匹配任何特殊字符 c（即，仅按照字面意义匹配，不匹配特殊含义

\a(\z) 匹配字符串的起始（结束）（另见上面介绍的^和$）

那么要想匹配上点号. 我们需要\. 加一个转义符斜杠

----------------------------------------------------------------

re 模块的函数介绍

本节将介绍两个主要的函数/方法——match()和 search()，以及 compile()函数。

re模块的函数

compile(pattern，flags = 0) 使用任何可选的标记来编译正则表达式的模式，然后返回一个正则表达式对象

----------------------------------------------------------------

re 模块函数和正则表达式对象的方法

match(pattern ， string ， flags=0）

尝试使用带有可选的标记的正则表达式的模式来匹配字符串。如果匹配成功，就返回

匹配对象；如果失败，就返回 none

search(pattern ， string ， flags=0)

使用可选标记搜索字符串中第一次出现的正则表达式模式。如果匹配成功，则返回匹

配对象；如果失败，则返回 none

findall(pattern ， string [, flags] )

查找字符串中所有（非重复）出现的正则表达式模式，并返回一个匹配列表

finditer(pattern ， string [, flags] )

与 findall()函数相同，但返回的不是一个列表，而是一个迭代器。对于每一次匹配，迭

代器都返回一个匹配对象

split(pattern ， string ， max=0)

根据正则表达式的模式分隔符，split 函数将字符串分割为列表，然后返回成功匹配的

列表，分隔最多操作 max 次（默认分割所有匹配成功的位置）

-----------------------------------------------------------------

sub(pattern ， repl ， string ， count=0)

使用 repl 替换所有正则表达式的模式在字符串中出现的位置，除非定义 count，否则就

将替换所有出现的位置（另见 subn()函数，该函数返回替换操作的数目）

purge()

清除隐式编译的正则表达式模式

group(num=0)

返回整个匹配对象，或者编号为 num 的特定子组

groups(default=none)

返回一个包含所有匹配子组的元组（如果没有成功匹配，则返回一个空元组）

groupdict(default=none)

返回一个包含所有匹配的命名子组的字典，所有的子组名称作为字典的键（如果没有

成功匹配，则返回一个空字典）

-------------------------------------------------------------------------

re.i、re.ignorecase 不区分大小写的匹配

re.l、re.locale 根据所使用的本地语言环境通过\w、\w、\b、\b、\s、\s 实现匹配

re.m、re.multiline ^和$分别匹配目标字符串中行的起始和结尾，而不是严格匹配整个字符串本身的起始

和结尾

re.s、re.dotall “.”（点号）通常匹配除了\n（换行符）之外的所有单个字符；该标记表示“.”（点号）

能够匹配全部字符

re.x、re.verbose 通过反斜线转义，否则所有空格加上#（以及在该行中所有后续文字）都被忽略，除非

在一个字符类中或者允许注释并且提高可读性

pat = "title=\".+?\"" 转移符号\,

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

新手学习Python2和Python3中print不同的用法

在python2和python3中都提供print()方法来打印信息,但两个版本间的print稍微有差异主要体现在以下几个方面：1.python3中print是... [阅读全文]
Python基于os.environ从windows获取环境变量

安装python之后，我们往往面临这样一个问题，在命令行输入“python”，竟然出错，难道是没有安装成功吗？非也，其实是你的系统环境变量没有设置好。今天，小编... [阅读全文]
keras实现调用自己训练的模型,并去掉全连接层

其实很简单from keras.models import load_modelbase_model = load_model('model_resenet.h... [阅读全文]
python中def是做什么的

python使用def开始函数定义，紧接着是函数名，括号内部为函数的参数，内部为函数的具体功能实现代码，如果想要函数有返回值, 在expressions中的逻... [阅读全文]
Python xlwt模块使用代码实例

简介写入excle文档安装：pip3 install xlwt导入：import xlwtxlrd 模块方法写入案例import xlwt# 创建对象，设置编码... [阅读全文]
Keras之自定义损失(loss)函数用法说明

在keras中可以自定义损失函数，在自定义损失函数的过程中需要注意的一点是，损失函数的参数形式，这一点在keras中是固定的，须如下形式：def my_loss... [阅读全文]
Python xlrd模块导入过程及常用操作

简介读取excle文档，支持xls，xlsx格式安装：pip3 install xlrd导入：import xlrdxlrd 模块方法读取excelfile =... [阅读全文]
keras打印loss对权重的导数方式

notes怀疑模型梯度爆炸，想打印模型 loss 对各权重的导数看看。如果如果fit来训练的话，可以用keras.callbacks.tensorboard实现... [阅读全文]
keras 使用Lambda 快速新建层添加多个参数操作

keras许多简单操作，都需要新建一个层，使用lambda可以很好完成需求。# 额外参数def normal_reshape(x, shape): return... [阅读全文]
JAVA及PYTHON质数计算代码对比解析

java 实现class primenumber{public static void main(string[] args) {long start=syst... [阅读全文]

网友评论


验证码：

Python正则

2019年12月01日 | 移动技术网IT编程 | 我要评论

常用的记住

您可能感兴趣的文章:

相关文章:

网友评论