当前位置：移动技术网 > IT编程>开发语言>正则 > 匹配中文的正则(GB2312/utf-8)

匹配中文的正则(GB2312/utf-8)

2017年12月12日 | 移动技术网IT编程 | 我要评论

i (pcre_caseless)
如果设定此修正符，模式中的字符将同时匹配大小写字母。

m（pcre_multiline）
默认情况下，pcre 将目标字符串作为单一的一“行”字符所组成的（甚至其中包含有换行符也是如此）。“行起始”元字符（^）仅仅匹配字符串的起始，“行结束”元字符（$）仅仅匹配字符串的结束，或者最后一个字符是换行符时其前面（除非设定了 d 修正符）。这和 perl 是一样的。

当设定了此修正符，“行起始”和“行结束”除了匹配整个字符串开头和结束外，还分别匹配其中的换行符的之后和之前。这和 perl 的 /m 修正符是等效的。如果目标字符串中没有“\n”字符或者模式中没有 ^ 或 $，则设定此修正符没有任何效果。

s（pcre_dotall）
如果设定了此修正符，模式中的圆点元字符（.）匹配所有的字符，包括换行符。没有此设定的话，则不包括换行符。这和 perl 的 /s 修正符是等效的。排除字符类例如 [^a] 总是匹配换行符的，无论是否设定了此修正符。

x（pcre_extended）
如果设定了此修正符，模式中的空白字符除了被转义的或在字符类中的以外完全被忽略，在未转义的字符类之外的 # 以及下一个换行符之间的所有字符，包括两头，也都被忽略。这和 perl 的 /x 修正符是等效的，使得可以在复杂的模式中加入注释。然而注意，这仅适用于数据字符。空白字符可能永远不会出现于模式中的特殊字符序列，例如引入条件子模式的序列 (?( 中间。

e
如果设定了此修正符，preg_replace() 在替换字符串中对逆向引用作正常的替换，将其作为 php 代码求值，并用其结果来替换所搜索的字符串。

只有 preg_replace() 使用此修正符，其它 pcre 函数将忽略之。

注意: 本修正符在 php3 中不可用。

a（pcre_anchored）
如果设定了此修正符，模式被强制为“anchored”，即强制仅从目标字符串的开头开始匹配。此效果也可以通过适当的模式本身来实现（在 perl 中实现的唯一方法）。

d（pcre_dollar_endonly）
如果设定了此修正符，模式中的美元元字符仅匹配目标字符串的结尾。没有此选项时，如果最后一个字符是换行符的话，美元符号也会匹配此字符之前（但不会匹配任何其它换行符之前）。如果设定了 m 修正符则忽略此选项。perl 中没有与其等价的修正符。

s
当一个模式将被使用若干次时，为加速匹配起见值得先对其进行分析。如果设定了此修正符则会进行额外的分析。目前，分析一个模式仅对没有单一固定起始字符的 non-anchored 模式有用。

u（pcre_ungreedy）
本修正符反转了匹配数量的值使其不是默认的重复，而变成在后面跟上“?”才变得重复。这和 perl 不兼容。也可以通过在模式之中设定 (?u) 修正符或者在数量符之后跟一个问号（如 .*?）来启用此选项。

x（pcre_extra）
此修正符启用了一个 pcre 中与 perl 不兼容的额外功能。模式中的任何反斜线后面跟上一个没有特殊意义的字母导致一个错误，从而保留此组合以备将来扩充。默认情况下，和 perl 一样，一个反斜线后面跟一个没有特殊意义的字母被当成该字母本身。当前没有其它特性受此修正符控制。

u（pcre_utf8）
此修正符启用了一个 pcre 中与 perl 不兼容的额外功能。模式字符串被当成 utf-8。本修正符在 unix 下自 php 4.1.0 起可用，在 win32 下自 php 4.2.3 起可用。自 php 4.3.5 起开始检查模式的 utf-8 合法性。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

C++：regex正则表达式

正则表达式在<regex>头文件中定义，是标准库中的一个强大工具。正则表达式是一种用于字符串处理的微... [阅读全文]
移动端调出纯数字键盘

为了适配ios和安卓，写了个十全大补汤，所有调用纯数字键盘的方式都用上了。安卓上虽然默认数字键盘，但是还是可以手... [阅读全文]
京东富文本详情图变形的多种处理方式（解决商品详情图片宽高不适应问题）

我前面写过一篇解析京东富文本详情的文章：https://blog.csdn.net/qq_35610214/ar... [阅读全文]
re正则表达式练习

判断变量名是否符合要求import re names = ["name1","_name","2_name","... [阅读全文]
通过Git上传项目到GitHub

一.git下载及安装git官网下载：https://git-scm.com/downloads。安装很简单，除了... [阅读全文]
常用前端相关知识

1.字符串.replace(正则, function(v,i,str){ return 'xxx' }) //... [阅读全文]
身份号码校验正则表达式(很强大,建议用我的!)

functionidentityCodeValid(code){varcity={11:"北京",12:"天津"... [阅读全文]
Linux-正则表达式练习题及答案

从ftp 下载regular_express.txt：过滤下载文件中包含the 关键字[root@zhang ~... [阅读全文]
神经网络架构搜索——二值可微分搜索（BATS）

二值可微分搜索（BATS）摘要方法搜索空间重定义标准 DARTS 搜索空间的问题二值神经网络搜索空间搜索的正则化... [阅读全文]
正则表达式详细图文举例介绍

文章目录正则实用网址特殊符号功能说明正则快捷表达式正则快捷表达式取反分组-GROUP（）非捕获分组回溯引用环视 ... [阅读全文]

网友评论


验证码：

匹配中文的正则(GB2312/utf-8)

2017年12月12日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论