当前位置：移动技术网 > IT编程>脚本编程>Python > python re正则表达式模块(Regular Expression)

python re正则表达式模块(Regular Expression)

2019年03月28日 | 移动技术网IT编程 | 我要评论

地狱神探快播,拳击黑市,蛋氨酸多少钱一斤

模块的的作用主要是用于字符串和文本处理，查找，搜索，替换等

复习一下基本的正则表达式吧

.：匹配除了换行符以为的任意单个字符

*：匹配任意字符，一个，零个，多个都能匹配得到俗称贪婪模式

+：匹配位于+之前的一个或者多个字符

|：匹配位于|之前或者之后的字符

^：匹配行首

$：匹配行尾

?：匹配位于？之前的零个或者一个字符，不匹配多个字符

\：表示 \ 之后的为转义字符

[]：匹配[]之中的任意单个字符,[0-9]表示匹配0到9任意一个数字

()：将位于()之内的的内容当作一个整体

{}：按{}中的次数进行匹配，100[0-9]{3}表示在100之后任意匹配一个3位数（100-999）

python中以\开头的元字符：

特殊序列符号	意义
\a	只在字符串开始进行匹配
\z	只在字符串结尾进行匹配
\b	匹配位于开始或结尾的空字符串
\b	匹配不位于开始或结尾的空字符串
\d	相当于[0-9]
\d	相当于[^0-9]
\s	匹配任意空白字符:[\t\n\r\r\v]
\s	匹配任意非空白字符:[^\t\n\r\r\v]
\w	匹配任意数字和字母:[a-za-z0-9]
\w	匹配任意非数字和字母:[^a-za-z0-9]

正则表达式语法表

语法	意义	说明
"."	任意字符
"^"	字符串开始	'^hello'匹配'helloworld'而不匹配'aaaahellobbb'
"$"	字符串结尾	与上同理
"*"	0 个或多个字符（贪婪匹配）	<*>匹配<title>chinaunix</title>
"+"	1 个或多个字符（贪婪匹配）	与上同理
"?"	0 个或多个字符（贪婪匹配）	与上同理
*?,+?,??	以上三个取第一个匹配结果（非贪婪匹配）	<*>匹配<title>
{m,n}	对于前一个字符重复m到n次，{m}亦可	a{6}匹配6个a、a{2,4}匹配2到4个a
{m,n}?	对于前一个字符重复m到n次，并取尽可能少	‘aaaaaa'中a{2,4}只会匹配2个
"\\"	特殊字符转义或者特殊序列
[]	表示一个字符集	[0-9]、[a-z]、[a-z]、[^0]
"\|"	或	a\|b,或运算
(...)	匹配括号中任意表达式
(?#...)	注释，可忽略
(?=...)	matches if ... matches next, but doesn't consume the string.	'(?=test)' 在hellotest中匹配hello
(?!...)	matches if ... doesn't match next.	'(?!=test)' 若hello后面不为test，匹配hello
(?<=...)	matches if preceded by ... (must be fixed length).	'(?<=hello)test' 在hellotest中匹配test
(?<!...)	matches if not preceded by ... (must be fixed length).	'(?<!hello)test' 在hellotest中不匹配test

匹配的标志和含义

标志	含义
re.i	忽略大小写
re.l	根据本地设置而更改\w,\w,\b,\b,\s,\s的匹配内容
re.m	多行匹配模式
re.s	使“.”元字符匹配换行符
re.u	匹配unicode字符
re.x	忽略需要匹配模式中的空格，并且可以使用"#"号注释

文本内容（提取linux下的password文件）

man:x:6:12:man:/var/cache/man:/bin/nologin

re模块中有３个搜索函数，每个函数都接受３个参数(匹配模式，要匹配的字符串，进行匹配的标志)，如果匹配到了就返回一个对象实例，么有就返会ｎone．

findall():用于在字符串中查找符合正则表达式的字符串，并返回这些字符串的列表

search():搜索整个字符串，返回对象实例

match():只从第一个字符开始匹配，后面的不再匹配，返回对象实例

lovelinux@lovelinux:~/py/boke$ cat text 
man:x:6:12:man:/var/cache/man:/bin/sh
lovelinux@lovelinux:~/py/boke$ cat test.py
#/usr/bin/env python
#coding:utf-8
import re
with open('text','r') as txt:
 f = txt.read()
 print re.match('bin',f)
 print re.search('bin',f).end() 
lovelinux@lovelinux:~/py/boke$ python test.py 
none
34
lovelinux@lovelinux:~/py/boke$ vim test.py
lovelinux@lovelinux:~/py/boke$ python test.py 
none
<_sre.sre_match object at 0x7f12fc9f9ed0>

返回是对象实例有２个方法，

start()：返回记录匹配到字符的开始索引　

end()：返回记录匹配到字符的结束索引

lovelinux@lovelinux:~/py/boke$ python test.py 
none
31
34
lovelinux@lovelinux:~/py/boke$ cat test.py 
#/usr/bin/env python
#coding:utf-8
import re
with open('text','r') as txt:
 f = txt.read()
 print re.match('bin',f)
 print re.search('bin',f).start()
 print re.search('bin',f).end()

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

python如何查看网页代码

用python查看网页代码的方法：1、使用“import”导入requests包import requests2、使用requests包的get()函数通过网页... [阅读全文]
Python如何用wx模块创建文本编辑器

用python的wx模块创建文本编辑器的方法：1、设置按钮的位置import wxapp = wx.app()win = wx.frame(none,title... [阅读全文]
python如何保存文本文件

python保存文本文件的方法：使用python内置的open()类可以打开文本文件，向文件里面写入数据可以用write()函数，写完之后，使用close()函... [阅读全文]
python如何编写win程序

python可以编写win程序。win程序的格式是exe，下面我们就来看一下使用python编写exe程序的方法。编写好python程序后py2exe模块即可将... [阅读全文]
Python替换NumPy数组中大于某个值的所有元素实例

我有一个2d(二维) numpy数组，并希望用255.0替换大于或等于阈值t的所有值。据我所知，最基础的方法是：shape = arr.shaperesult ... [阅读全文]
使用Numpy对特征中的异常值进行替换及条件替换方式

原始数据为excel文件，由传感器获得，通过pyhton xlrd模块读入，读入后为数组形式，由于其存在部分异常值和缺失值，所以便利用numpy对其中的异常值进... [阅读全文]
Python 实现将numpy中的nan和inf,nan替换成对应的均值

nan：not a numberinf：infinity;正无穷numpy中的nan和inf都是float类型t!=t 返回bool类型的数组(矩阵)np.co... [阅读全文]
给ubuntu18安装python3.7的详细教程

参考文章准备工作安装工具sudo apt updatesudo apt upgradesudo apt install gccsudo apt install ... [阅读全文]
python爬虫把url链接编码成gbk2312格式过程解析

1. 问题　　抓取某个网站，发现请求参数是乱码格式，这是点击 textview，发现请求参数如下图所示3. 那么=%b9%fa%ce%f1%d4%ba%b7%a... [阅读全文]
pyecharts在数据可视化中的应用详解

使用pyecharts进行数据可视化安装 pip install pyecharts也可以在pycharm软件里进行下载pyecharts库包。下载成功后进行查... [阅读全文]

网友评论


验证码：

python re正则表达式模块(Regular Expression)

2019年03月28日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论