当前位置：移动技术网 > IT编程>脚本编程>Python > python笔记-----正则表达式

python笔记-----正则表达式

2018年04月28日 | 移动技术网IT编程 | 我要评论

福布斯中国企业排行榜,遮天镇命歌歌词,王者荣耀图片

创建正则表达式对象

import re

常用匹配语法

re.match 从头开始匹配

re.search 匹配包含

re.findall 把所有匹配到的字符放到以列表中的元素返回

re.splitall 以匹配到的字符当做列表分隔符

re.sub 匹配字符并替换

re.compile(r'(\d\d\d)-(\d\d\d-\d\d\d\d)') 创建匹配对象

常用正则表达式符号

. 默认匹配除\n之外的任意一个字符，若指定flag DOTALL，则匹配任意字符，包括换行

^ 匹配字符开头，若指定flags MULTILINE，这种也可以匹配上(r”^a”,”\nabc\neee”,flag=re.MULTILINE)

$ 匹配字符串结尾，或e.search(”foo$”,”bfoo\nnsdfsf”,flags=re.MULTILINE).group()也可以

* 匹配*号前的字符0次或多次，re.findall(“ab*”,”cabb3abcbbac”) 结果为[‘abb’,’ab’,’a’]

+ 匹配前一个字符1次或多次，re.findall("ab+","ab+cd+abb+bba") ['ab', 'abb']

? 匹配前一个字符1次或0次

{m}匹配前一个字符m次 re.findall("b{3}","ab+cd+abbb+bba") ['bbb']

{n,m} 匹配前一个字符n到m次 re.findall("b{1,2}","ab+cd+abbb+bba") ['b', 'bb', 'b', 'bb'] 后边加问好是匹配最少不加则是最多

| 匹配|左或|右的字符 re.findall("b|c","ab+cd+abbb+bba") ['b', 'c', 'b', 'b', 'b', 'b', 'b']

(...)分组匹配

\A 只从字符开头匹配

\Z 匹配字符结尾同$

\d 匹配数字0-9

\D 匹配非数字

\w 匹配[A-Za-z0-9]

\W匹配非[A-Za-z0-9]

\s 匹配空白字符。\t \n \r

\S匹配除了空白字符。\t \n \r

(?P<name>…)分组匹配

匹配实例

1.创建匹配对象compile()方法

import re
a = re.compile(r'\d+')
a1 = a.search('gfd12341ahvcnxjbkafa')
print(a1.group()) # .group()直接输出结果，而不是返回对象

结果

12341

2.从头开始匹配 match()方法

import re
a = re.match("^w.+", "wdasfdsafdsa1223fdssfd33311")
b = re.match("^[a-z]+", "wdasfdsafdsa1223fdssfd33311")
c = re.search("R[a-zA-z]+a", "wdasfdsafdsa1223fdssfd33311")
print(a)
print(b)
print(c)

结果如下

<_sre.SRE_Match object; span=(0, 27), match='wdasfdsafdsa1223fdssfd33311'>
<_sre.SRE_Match object; span=(0, 12), match='wdasfdsafdsa'>
None

3.匹配包含search()方法

import re
a = re.search("[a-z]+","abcdefg12345")

print(a.group())

结果如下

abcdefg

4.管道匹配多个分组 |

import re
hero = re.compile(r'ABC|DEF')
m1 = hero.search('ABC hehe ABC')
print(m1.group())
m2 = hero.search('DEF hehe ABC')
print(m2.group())

结果如下

ABC
DEF

5.分组匹配 () 和group()

import re

phoneNum = re.compile(r'(\d\d\d)-(\d\d\d-\d\d\d\d)')
mo = phoneNum.search('my number is 415-555-4242')
print(mo.group(1))   #输出第一个组
print(mo.group(2)) #输出第二个组
print(mo.group(0))    #输出所有
print(mo.group())    #输出所有

结果

415
555-4242
415-555-4242
415-555-4242

6.用问号实现可选匹配

import re
b = re.compile(r'Bat(wo)?man')
mo = b.search('The Adventures of Batman')
print(mo.group())
mo1 = b.search('The Adventures of Batwoman')
print(mo1.group())

结果

Batman

Batwoman

7.用星号匹配零次或多次

import re

b = re.compile(r'Bat(wo)*man')
mo = b.search('The Adventures of Batman')
print(mo.group())
mo1 = b.search('The Adventures of Batwoman')
print(mo1.group())
mo2 = b.search('The Adventures of Batwowowowowoman')
print(mo2.group())

结果

Batman
Batwoman
Batwowowowowoman

8.用+号匹配一次或多次

import re

b = re.compile(r'Bat(wo)+man')
mo = b.search('The Adventures of Batwoman')
print(mo.group())
mo1 = b.search('The Adventures of Batwoman')
print(mo1.group())
mo2 = b.search('The Adventures of Batwowowowowoman')
print(mo2.group())

结果

Batwoman

Batwowowowowoman

9.用花括号匹配特定次数

import re

b = re.compile(r'(ha){3}')
mo = b.search('hahahahahaha')
print(mo.group())

结果

hahaha

10.花括号匹配最多和最少次数

import re

b = re.compile(r'(ha){3,5}') #匹配3到5次
mo = b.search('hahahahahaha') #什么都不加默认匹配最多个
print(mo.group())
b1 = re.compile(r'(ha){3,5}?') #加问号匹配最少的个数
mo1 = b1.search('hahahahahaha')
print(mo1.group())

结果

hahahahaha
hahaha

11.findall()方法

import re
b = re.compile(r'\d\d\d\d-\d\d\d\d')
mo = b.findall('call: 1234-4321 work:8521-5155')
print(mo)

返回结果列表

['1234-4321', '8521-5155']

分组匹配

import re
b = re.compile(r'(\d\d\d\d)-(\d\d\d\d)')
mo = b.findall('call: 1234-4321 work:8521-5155')
print(mo)

返回结果列表元组

[('1234', '4321'), ('8521', '5155')]

12.建立自己的字符分类

匹配[]中的元素和匹配除[]中的元素

import re

v = re.compile(r'[^abc]')
v1 = v.findall('gafeagbbbbfsdgfaccsgzfevcsdfdf')
print(v1)
q = re.compile(r'[abc]')
q1 = q.findall('gafeagbbbbfsdgfaccsgzfevcsdfdf')
print(q1)

结果

['g', 'f', 'e', 'g', 'f', 's', 'd', 'g', 'f', 's', 'g', 'z', 'f', 'e', 'v', 's', 'd', 'f', 'd', 'f']

['a', 'a', 'b', 'b', 'b', 'b', 'a', 'c', 'c', 'c']

13.不区分大小写匹配 re.IGNORECASE或re.I

import re
a = re.compile(r'efg', re.I)
print(a.search('ABCDEFG').group())
结果
EFG

14.sub()方法替换字符串

import re

a = re.compile(r'ABC')

print(a.sub(r'123','ABCDEFG'))

结果

123DEFG

15.管理复杂的正则表达式re.VERBOSE

import re
a = re.compile(r'''(
(\d{3}|$\d{3}$)? #注释
)''',re.VERBOSE)
b = a.search('123,32141,321,fdsafdgdacszc')
print(b.group())

看结果

123

正则表达式符号总结

? 匹配零次或一次前面的分组

* 匹配零次或多次前面的分组

+ 匹配一次或多次前面的分组

{n} 匹配n次前面的分组

{n,} 匹配n次或更多前面的分组

{,m} 匹配零次到m次前面的分组

{n,m} 匹配至少n次，至多m次前面的分组

{n,m} ?或*?或+?对前面的分组进行最少/最多次匹配

^spam 意味着字符串必须以spam开始

spam$ 意味着字符串必须以spam结束

. 匹配所有字符，换行符除外

\d \w \s 分别匹配数字，单词和空格

\D \W \S 分别匹配出数字，单词和空格外的所有字符

[abc] 匹配中括号内的任意字符（a，b或c）

[^abc] 匹配不在中括号内的任意字符

如果想匹配. * +这样的字符请用转义字符\,如\. \* \+

其他的匹配符号大家可以自己去组合去尝试，这里不一一列举了

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

新手学习Python2和Python3中print不同的用法

在python2和python3中都提供print()方法来打印信息,但两个版本间的print稍微有差异主要体现在以下几个方面：1.python3中print是... [阅读全文]
Python基于os.environ从windows获取环境变量

安装python之后，我们往往面临这样一个问题，在命令行输入“python”，竟然出错，难道是没有安装成功吗？非也，其实是你的系统环境变量没有设置好。今天，小编... [阅读全文]
keras实现调用自己训练的模型,并去掉全连接层

其实很简单from keras.models import load_modelbase_model = load_model('model_resenet.h... [阅读全文]
python中def是做什么的

python使用def开始函数定义，紧接着是函数名，括号内部为函数的参数，内部为函数的具体功能实现代码，如果想要函数有返回值, 在expressions中的逻... [阅读全文]
Python xlwt模块使用代码实例

简介写入excle文档安装：pip3 install xlwt导入：import xlwtxlrd 模块方法写入案例import xlwt# 创建对象，设置编码... [阅读全文]
Keras之自定义损失(loss)函数用法说明

在keras中可以自定义损失函数，在自定义损失函数的过程中需要注意的一点是，损失函数的参数形式，这一点在keras中是固定的，须如下形式：def my_loss... [阅读全文]
Python xlrd模块导入过程及常用操作

简介读取excle文档，支持xls，xlsx格式安装：pip3 install xlrd导入：import xlrdxlrd 模块方法读取excelfile =... [阅读全文]
keras打印loss对权重的导数方式

notes怀疑模型梯度爆炸，想打印模型 loss 对各权重的导数看看。如果如果fit来训练的话，可以用keras.callbacks.tensorboard实现... [阅读全文]
keras 使用Lambda 快速新建层添加多个参数操作

keras许多简单操作，都需要新建一个层，使用lambda可以很好完成需求。# 额外参数def normal_reshape(x, shape): return... [阅读全文]
JAVA及PYTHON质数计算代码对比解析

java 实现class primenumber{public static void main(string[] args) {long start=syst... [阅读全文]

网友评论


验证码：

python笔记-----正则表达式

2018年04月28日 | 移动技术网IT编程 | 我要评论

创建正则表达式对象

常用匹配语法

常用正则表达式符号

匹配实例

1.创建匹配对象compile()方法

2.从头开始匹配 match()方法

3.匹配包含search()方法

4.管道匹配多个分组 |

5.分组匹配 () 和group()

6.用问号实现可选匹配

7.用星号匹配零次或多次

8.用+号匹配一次或多次

9.用花括号匹配特定次数

10.花括号匹配最多和最少次数

11.findall()方法

12.建立自己的字符分类

13.不区分大小写匹配 re.IGNORECASE或re.I

14.sub()方法替换字符串

15.管理复杂的正则表达式re.VERBOSE

正则表达式符号总结

您可能感兴趣的文章:

相关文章:

网友评论