php专区

 首页 > php专区 > 正则表达式 > .NET 正则表达式使用高级技巧之替换类介绍_正则

.NET 正则表达式使用高级技巧之替换类介绍_正则

分享到:
【字体:
导读:
          因为.net的基本正则语法和Perl5基本相同,所以基本语法你可以去下载一下M$的JS帮助文档,上面有详细的说明...

d表示什么,{,5}表示什么,[表示什么……,这里我只想提醒大家一点,为了避免和反向引用相冲突,在你用nn表示八进制的ASCII码时,请在后加0,就是说,40在表示ASCII码时,请这样写40。 

  替换 

  Regex类有一个静态的Replace方法,其实例也有一个Replace方法,这个方法很强大,因为它可以传入一个delegate,这样,你可以自定义每次捕获匹配时,如何处理捕获的内容。
 
  以上这段代码说明了如果使用delegate MatchEvaluator 来处理正则的Match结果,该代码返回"01 12 03 05"。Replace方法除了使用delegate来处理捕获的Match,还可以用字符串来替换Match的结果,而用字符串来替换Match结果除了把Match结果静态的替换成一个固定的文本外,还可以使用以下语法来更方便的实现你需要的功能: 
复制代码 代码如下:

public static void Main()
{
string s = "1 12 3 5";
s = Regex.Replace(s,@"d+",new MatchEvaluator(CorrectString),RegexOptions.Compiled|RegexOptions.IgnoreCase);
Console.WriteLine(s);
Console.ReadLine();
}
private static string CorrectString(Match match)
{
string matchValue = match.Value;
if(matchValue.Length == 1)
matchValue = "0" + matchValue;
return matchValue;
}


$number

  把匹配的第number组替换成替换表达式,还有这句话怎么写也表达不清楚意思,还是来个例子吧:

 public static void Main() 
 { 
 string s = "1 12 3 5"; 
 s = Regex.Replace(s,@"(d+)(?#这个是注释)","0$1",RegexOptions.Compiled|RegexOptions.IgnoreCase); 
 Console.WriteLine(s); 
 Console.ReadLine(); 
 }

  这段代码返回的是 “01 012 03 05” 

  就是说,对组一的每个匹配结果都用"0$1"这个表达式来替换,"0$1"中"$1"由组1匹配的结果代入

${name}   把匹配的组名为"name"的组替换成表达式, 

  上例的Regex expression改成@"(?d+)(?#这个是注释)"后面的替换式改为"0${name}"结果是一样的
$$   做$的转义符,如上例表达式改成@"(?d+)(?#这个是注释)"和"$$${name}",则结果为"$1 $12 $3 $5"
$&   替换整个匹配
$`   替换匹配前的字符
$'   替换匹配后的字符
$+   替换最后匹配的组
$_   替换整个字符串
  
  后面的选项,大家自己写个例子体味一下。 

  *注,上例中的(?#这个是注释)说明了正则的内联注释语法为(?#) 

  表达项选项 

  正则表达式选项RegexOptions有如下一下选项,详细说明请参考联机帮助 

RegexOptions枚举值 内联标志 简单说明
ExplicitCapture n 只有定义了命名或编号的组才捕获
IgnoreCase i 不区分大小写
IgnorePatternWhitespace x 消除模式中的非转义空白并启用由 # 标记的注释。
MultiLine m 多行模式,其原理是修改了^和$的含义
SingleLine s 单行模式,和MultiLine相对应
  
  这里我提到内联标志,是因为相对于用RegexOptions在new Regex时定义Regex表达式的全局选项来说,内联标志可以更小粒度(以组为单位)的定义匹配选项,从而更方便表达我们的思想 

  语法是这样的:(?i:expression)为定义一个选项,(?-i:expression)为删除一个选项,(?i-s:expression)则定义i,删除s,是的,我们可以一次定义很多个选项。这样,通过内联选项,你就可以在一个Regex中定义一个组为匹分大小写的,一个组不匹分大小写的,是不是很方便呢?

分享到:
正则表达式常用元字符整理小结_正则表达...
正则表达式语言由两种基本字符类型组成:原义(正常)文本字符和元字符。元字符使正则表达式具有处理能力。元字符既可以是放在 [] 中的任意单个字符(如 [a] 表示匹配单个小写字符 a ),也可以是字符序列(如 [a-d] 表示匹配 a 、 b 、 c 、 d 之间的任意一个字符,而 \w 表示任意英文字母和数字及下划线),下面是一些常...
正则表达式字面量在ECMAScript5中的变化_...
在《JavaScript语言精粹》的第72页有这样一段: 用正则表达式字面量创建的RegExp对象来共享同一个单实例: 复制代码 代码如下: function make_a_matcher( ) { return /a/gi; } var x = make_a_matcher( ); var y = make_a_matcher( ); // 注意:x 和 y 是同一个对象! x.lastIndex = 10; document.writeln(y.lastIndex); ...
  •         php迷,一个php技术的分享社区,专属您自己的技术摘抄本、收藏夹。
  • 在这里……