当前位置：移动技术网 > IT编程>开发语言>正则 > 大佬们才玩的正则表达式，看完你也会

大佬们才玩的正则表达式，看完你也会

2020年07月11日 | 移动技术网IT编程 | 我要评论

大佬们才玩的正则表达式

什么是正则表达式

简单来说，正则表达式就是用一些特定的符号来代替字符串

元字符

代码	说明
.	匹配除\n以外的任意字符
\w	匹配数字或字母或 _
\W	匹配非数字或字母或 _
\s	匹配任意的空白符（空格，换行，字表符）
\S	匹配非空白符
\d	匹配所有数字
\D	匹配非数字
\b	匹配单词的开始或结束（边界）
\B	匹配非单词边界
^	匹配字符串的开始
$	匹配字符串的结束

字符转义

代码	说明
\f	匹配一个换页符
\n	匹配一个换行符
\r	匹配一个回车符
\t	匹配一个水平制表符
\v	匹配一个垂直制表符
*	匹配*
.	匹配.
\	匹配\

集合

代码	说明
x \| y	匹配x或y
[xyz]	字符集合。匹配所包含的任意一个字符。例如’[abc]’ 可以匹配 “plain” 中的 ‘a’。
[^xyz]	负值字符集合。匹配未包含的任意字符。例如’[^abc]’ 可以匹配 “plain” 中的’p’、‘l’、‘i’、‘n’。
[a-z]	字符范围。匹配指定范围内的任意字符
[^a-z]	负值字符范围。匹配任何不在指定范围内的任意字符。

分组

分类	代码	说明
捕获	(exp)	匹配exp，并捕获文本到自动命名的组里面
	(?<name>exp)	匹配exp，并捕获文本到名称为name的组里
	(?:exp)	匹配exp，不捕获匹配的文本，也不给此分组分配编号
零度断言	(?=exp)	匹配exp前面的位置
	(?<=exp)	匹配exp后面的位置
	(?!exp)	匹配后面跟着不是exp的位置
	(?<!exp)	匹配强面不是exp的位置
注释	(?#comment)	这种类型的分组不对正则表达式的处理产生任何影响，只是提供注释让人阅读

每使用一对()小括号，就是分了一个小组，并且每个小组都有一个编号

系统自动分配编号的原则是：

从左到右分配编号，第一个组是1，第二个是2，以此类推（正则表达式整体是一个组，编号为0）
实现上会从右到左查询两次，第一次给未命名的组分配组号，第二次给已命名的组分配组号
可以使用(?:xxx)的语法来让一个组不参与自动分配组号

后向引用

后向引用是指通过反斜杠\加上数字（编号）的方式来重复使用某一组的正则表达式

例如：(\d+)\s{1}\1这个式子中可看出\d+是第1组，编号就是1，后面的\1就是引用了前面这一组的内容，相当于 (\d+)\s{1}(\d+)

零度断言

匹配宽度为0，在匹配元素的位置设置断点

比如一个字符串ddexpaa

dd(?=exp)：匹配exp前面的dd
(?=exp)aa：匹配exp后面的aa

贪婪与懒惰

比如一个字符串aabab

贪婪的正则匹配：a.*b ==> 匹配到aabab一个结果

懒惰的正则匹配：a.*?b ==> 匹配到aab和ab两个结果

贪婪的重复

代码	说明
*	重复0次或者无数次
+	重复1次或者无数次
?	重复0次或者1次
{n}	重复n次
{n,}	重复n次或者重复n次以上
{n, m}	重复n到m次

懒惰的重复

代码	说明
*?	重复任意次，但尽可能少重复
+?	重复1次或者更多次，但尽可能少重复
??	重复0次或者1次，但尽可能少重复
{n,m}?	重复n到m次，但尽可能少重复
{n,}?	重复n次以上，但尽可能少重复

常见的正则表达式

手机号码：/^1[3456789][0-9]{9}$/
座机：/^(0\d{2,3}-\d{7,8})(-\d{1,4})?$/
身份证：/(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)/
长度在6-18之间的，只能包括字母、数字和下划线：/^[a-zA-Z]\w{5,17}$/
邮政编码：/[1-9]\d{5}(?!\d)/
QQ号：/^[1-9][0-9]{4,9}$/
邮箱：/^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$/
金额（小数两位）：/^\d*(?:\.\d{0,2})?$/
网址：/(http|ftp|https):\/\/[\w\-_]+(\.[\w\-_]+)+([\w\-\.,@?^=%&:/~\+#]*[\w\-\@?^=%&/~\+#])?/
IP：/((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))/
日期时间：/^(\d{4})\-(\d{2})\-(\d{2}) (\d{2})(?:\:\d{2}|:(\d{2}):(\d{2}))$/.test(str) || /^(\d{4})\-(\d{2})\-(\d{2})$/
数字：/^[0-9]$/ 或者 /^\d$/
英文：/^[a-zA-Z]+$/
中文：/^[\\u4E00-\\u9FA5]+$/
小写：/^[a-z]+$/
大写：/^[A-Z]+$/
HTML标记：/<("[^"]*"|'[^']*'|[^'">])*>/

本文地址：https://blog.csdn.net/qq_45007419/article/details/107235024

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

JAVA 正则表达式陈广佳版本(超详细)

在sun的java jdk 1.40版本中，java自带了支持正则表达式的包，本文就抛砖引玉地介绍了如何使用java.util.regex包。　　可粗略估计一下... [阅读全文]
一文秒懂python正则表达式常用函数

导读：正则表达式是处理字符串类型的"核武器"，不仅速度快，而且功能强大。本文不过多展开正则表达式相关语法，仅简要介绍 python中正则表达式常用函数及其使... [阅读全文]
Python常用的正则表达式处理函数详解

正则表达式是一个特殊的字符序列，用于简洁表达一组字符串特征，检查一个字符串是否与某种模式匹配，使用起来十分方便。在python中，我们通过调用re库来使用re模... [阅读全文]
linux grep与正则表达式使用介绍

grep （缩写来自globally search a regular expression and print）是一种强大的文本搜索工具，它能使用特定模式匹配... [阅读全文]
linux grep不区分大小写查找字符串方法

grep用来过滤字符串信息，grep默认对字母大小写敏感，不过可以通过选项对grep屏蔽大小写敏感，该选项为 -i。一、查看grep工具版本方法图1 grep版... [阅读全文]
解析正则表达式中的.*，.*?，.+?的含义

1. .*. 表示匹配除换行符 \n 之外的任何单字符，*表示零次或多次。所以.*在一起就表示任意字符出现零次或多次。没有?表示贪婪模式。比如a.*b，... [阅读全文]
正则表达式+Python re模块详解

正则表达式（regluar expressions）又称规则表达式，在代码中常简写为res，regexes或regexp（regex patterns）。它本质... [阅读全文]
浅谈js正则字面量//与new RegExp的执行效率

前几天谈了正则匹配 js 字符串的问题：《》和《》。里面讲到了优化正则起到提升性能的问题，但是能提升多少呢？于是我去测试了，发现tmd几乎微乎其微，我用1千... [阅读全文]
浅谈js正则之test方法bug篇

其实我很少用这个，所以之前一直没注意这个问题，自从落叶那厮写了个变态的测试我才去看了下这东西下面的代码都是在chrome的f12下调试的，大家可以研究一下先来看... [阅读全文]
js 正则学习小记之匹配字符串字面量优化篇

昨天在《js 正则学习小记之匹配字符串字面量》谈到 /"(?:\\.|[^"])*"/ 是个不错的表达式，因为可以满足我们的要求，所以这个表达式可用，但... [阅读全文]

网友评论


验证码：