php专区

 首页 > php专区 > 正则表达式 > 正则 捕获组(capture group)_正则表达式

正则 捕获组(capture group)_正则表达式

分享到:
【字体:
导读:
          捕获组就是把正则表达式中子表达式匹配的内容,保存到内存中以数字编号或手动命名的组里,方便后面引用...

捕获组有两种形式
一种是普通的捕获组,不产生歧义的情况下,后面简称捕获组,语法规则:(expression);
另一种是命名捕获组,语法规则:(?expression)或者(?'name'expression),这两种写法是等价的。
 
1、编号规则
如果没有显式为捕获组命名,即没有使用命名捕获组,那么需要按数字顺序来访问所有捕获组
在只有普通捕获组的情况下,捕获组的编号是按照“(”出现的顺序,从左到右编号的 
 
(d{4})-(d{2}-(dd))
1        1 2          3    3 2
 
上面的正则表达式可以用来匹配格式为yyyy-MM-dd的日期,为了在下表中得以区分,采用了d{2}和dd两种写法
还有一个默认编号为0的组,表示的是正则表达式的整体
用以上正则表达式匹配字符串:2008-12-31
匹配结果为:
编号 命名 捕获组 匹配内容
0   (d{4})-(d{2}-(dd)) 2008-12-31
1   (d{4}) 2008
2   (d{2}-(dd)) 12-31
3   (dd) 31
 
如果对组进行了显式命名,即命名捕获组,那么捕获的内容可以通过组名称来引用
但是如果正则表达式中既使用了普通捕获组,也使用了命名捕获组,那么捕获组的编号就要特别注意,编号的规则是先对普通捕获组进行编号,再对命名捕获组进行编号
 
(d{4})-(?d{2}-(dd))
1        1 3                       2     23
 
用以上正则表达式匹配字符串:2008-12-31
匹配结果为:
编号 命名 捕获组 匹配内容
0   (d{4})-(d{2}-(dd)) 2008-12-31
1   (d{4}) 2008
2   (dd) 31
3 date (?d{2}-(dd)) 12-31
 
 
2、捕获组的引用
对捕获组的引用一般有以下几种
a) 正则表达式中,对前面捕获组捕获的内容进行引用,称为反向引用
b) 正则表达式中,(?(表达式)true|false)的条件表达式
c) 在程序中,对捕获组捕获内容的引用
 
反向引用
对于普通捕获组的引用,语法规则为:k,通常简写为num,其中num是十进制的数字,即捕获组的编号
对于命名捕获组的引用,语法规则为:k或者k'name'
分享到:
Dreamweaver 正则替换(返回调用值)_正则...
例1: List-j/1100.aspx --> List.aspx?id=1100 List-j/(\d+).aspx --> List.aspx?id=$1 例2: List.aspx?id=1100 --> List-j/1100.aspx List.aspx\?jt=(\d+) --> List-j/$1.aspx (注:" List.aspx?id=1100"中出现"?"需转义)
正则基础之 小数点_正则表达式
一些细节 对于使用传统NFA引擎的大多数语言和工具,如Java、.NET来说,“.”的匹配范围是匹配除了换行符“\n”以外的任意一个字符。 但是对于javascript来说有些特殊,由于各浏览器的解析引擎不同,“.”的匹配范围也有所不同,对于Trident内核的浏览器,如IE来说,“.”同样是匹配除了换行符“\n”以外的任意一个字符,但...
  •         php迷,一个php技术的分享社区,专属您自己的技术摘抄本、收藏夹。
  • 在这里……