当前位置：移动技术网 > IT编程>脚本编程>Ruby > 使用Ruby re模块创建复杂的正则表达式

使用Ruby re模块创建复杂的正则表达式

2017年12月08日 | 移动技术网IT编程 | 我要评论

例如，考虑下面的匹配日期的正则表达式：

/\a((?:19|20)[0-9]{2})[\- \/.](0[1-9]|1[012])[\- \/.](0[1-9]|[12][0-9]|3[01])\z/

使用re之后，正则表达式可以短小易读的表达式为基础，一步一步地构建出来，例如：

复制代码代码如下:

require 're'

include re

delim                = re.any("- /.")
century_prefix       = re("19") | re("20")
under_ten            = re("0") + re.any("1-9")
ten_to_twelve        = re("1") + re.any("012")
ten_and_under_thirty = re.any("12") + re.any("0-9")
thirties             = re("3") + re.any("01")

year = (century_prefix + re.digit.repeat(2)).capture(:year)
month = (under_ten | ten_to_twelve).capture(:month)
day = (under_ten | ten_and_under_thirty | thirties).capture(:day)

date = (year + delim + month + delim + day).all

虽然代码量增加了，但是每个部分都很短小，也很容易验证。同时，捕获的部分可以通过相应的变量名访问：

复制代码代码如下:

result = date.match("2009-01-23")
result[:year]      # => "2009"
result[:month]     # => "01"
result[:day]       # => "23"

注意，用re构建正则表达式会很慢，所以推荐创建正则表达式并复用。匹配的时候，性能和原生的正则表达式很接近。（额外的方法调用和创建re::result以返回匹配结果影响一点点性能。）如果你需要追求极致的性能，你仍然可以使用re来构建正则表达式，然后抽取出原始的ruby regexp来匹配。这样的话，性能就和使用原生正则表达式一样了。

例如，构建匹配电话号码的正则表达式：

复制代码代码如下:

phone_re = re.digit.repeat(3).capture(:area) +
               re("-") +
               re.digit.repeat(3).capture(:exchange) +
               re("-") +
               re.digit.repeat(4)).capture(:subscriber)

然后抽取出原始的正则对象，直接使用它来匹配：

复制代码代码如下:

phone_regexp = phone_re.regexp

if phone_regexp =~ string
# blah blah blah
end

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

循序渐进掌握递归正则表达式

一般来说，递归的正则表达式用来匹配任意嵌套层次的结构或左右对称的结构。例如匹配：递归正则在正则表达式里算是比较灵活的部分，换句话说就是可能会比较难... [阅读全文]
scrapy 使用

启动方式：写一个启动文件,与配置文件同级 from scrapy.cmdline import execute import sys,os sys... [阅读全文]
[Python]基于tkinter的九型人格测试系统介绍

基于tkinter的九型人格测试系统介绍一、程序代码地址，GitHub 二、程序介绍 1、login.py 登录界面：注册界面： 2、mainW... [阅读全文]
day011_步入百万年薪的第十一天

day11 函数名的第一类对象及使用 1、可以当作值被赋值给变量 2、当作元素存放在容器中 3、函数名可以当作函数的参数 4、函数名可以当作函数的返... [阅读全文]
经典例题

例题: 1.用户输入账号 2.用户输入密码 3.判断用户的账号是不是alex 4.如果账号是alex在继续判断密码是不是alexdsb 5.账号和密... [阅读全文]
2019-07-11 闭包函数和装饰器

一、闭包函数定义：定义在内部的函数引用外部函数的名字（变量）叫做闭包函数要打印的是inner函数的x，因为这个函数里面没有定义x的值，所以找上一... [阅读全文]
day06_步入百万年薪的第六天

day06 小数据池小数据池——缓存机制（驻留机制），只是一种规格，不会实际的开辟一个空间 == 判断两边内容是否相等 is 基于内存地址进行判断... [阅读全文]
day05_步入百万年薪的第五天

day05 字典字典—— dict：字典无序的，可变的数据类型用于存储大量数据，字典要比列表快，将数据和数据之间进行关联逗号分隔叫做一个元素... [阅读全文]
day04_步入百万年薪的第四天

day04 列表列表——list 有序，可变，支持索引列表：存储数据，支持的数据类型很多：字符串，数字，布尔值，列表，集合，元组，字典，用逗... [阅读全文]
自动化部署Ruby on Rails应用(docker + jenkins)

服务器环境为Ubuntu 16.04.2 LTS 1.卸载旧版本docker 2.安装docker，使用脚本自动安装 3.启动docker 4.安装... [阅读全文]

网友评论


验证码：

使用Ruby re模块创建复杂的正则表达式

2017年12月08日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论