正则表达式(REGular EXPression,REGEXP)是对字符串和特殊字符(元字符)操作的一种逻辑公式,使用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。通常被用来检索、替换那些符合某个模式的文本。
正则表达式又分为基本正则表达式(Basic REGEXP)和扩展正则表达式(Extended REGEXP)。
常见的用途就是用来比对垃圾邮件。
列举一些万用字符,跟正则表达式不通。
[]:括号内的单个字符
- [abcd]:可以是a,b,c,d中任何一个,但必须有
- [0-9]:可以是0到9的任何一个数字,但必须有
[^]:非括号内字符的单个字符
特殊符号 | 代表意义 |
---|---|
[:alnum:] | 0-9,a-z,A-Z |
[:alpha:] | a-z,A-Z |
[:digit:] | 0-9 |
[:xdigit:] | 任何十六进制数字 |
[:lower:] | a-z |
[:upper:] | A-Z |
[:cntrl:] | ASCII控制字符(ASCII 0~31 和 ASCII 127) |
[:print:] | 任何可打印字符 |
[:punct:] | 标点符号 |
[:blank:] | 空格或制表符([\t ]) |
[:graph:] | 除空白字符外的其他字符 |
[:space:] | 任何空白字符,包括空格([\f\n\r\t\v ]) |
贪婪模式 .:匹配任意单个字符 *:匹配其前面的字符任意次 .*:匹配任意长度的任意字符 \?:匹配其前面的字符1次或0次 \{m,n\}:匹配其前面的字符至少m次 位置锚定 ^:锚定行首,此字符后面的任意内容必须出现在行首 $:锚定行尾,此字符前面的任意内容必须出现在行尾 ^$:空白行 \<或\b:锚定词首,其后面的任意字符必须作为单词首部出现 \>或\b:锚定词尾,其前面的任意字符必须作为单词尾部出现 分组:\(\) 后向引用 \1:引用第一个左括号以及与之对应的右括号所包括的所有内容 或者 |:or
如对本文有疑问, 点击进行留言回复!!
linux下文本编辑器vim的使用方法(复制、粘贴、替换、行号、撤销、多文件操作)
网友评论