当前位置: 移动技术网 > IT编程>脚本编程>Python > Python爬虫系列:五、正则表达式

Python爬虫系列:五、正则表达式

2019年12月05日  | 移动技术网IT编程  | 我要评论

田果扮演者,金仨胖,开通创业板的条件

1.了解正则表达式

正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。

正则表达式是用来匹配字符串非常强大的工具,在其他编程语言中同样有正则表达式的概念,python同样不例外,利用了正则表达式,我们想要从返回的页面内容提取出我们想要的内容就易如反掌了。

正则表达式的大致匹配过程是:
1.依次拿出表达式和文本中的字符比较,
2.如果每一个字符都能匹配,则匹配成功;一旦有匹配不成功的字符则匹配失败。
3.如果表达式中有量词或边界,这个过程会稍微有一些不同。

2.正则表达式的语法规则

  请自行百度,有更详细的讲解。

3.python re模块

python 自带了re模块,它提供了对正则表达式的支持。主要用到的方法列举如下

 

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网