php专区

 首页 > php专区 > 正则表达式 > js 正则表达式学习笔记之匹配字符串_正则表达式

js 正则表达式学习笔记之匹配字符串_正则表达式

分享到:
【字体:
导读:
          这篇文章主要介绍了js 正则表达式匹配字符串,需要的朋友可以参考下...

今天看了第5章几个例子,有点收获,记录下来当作回顾也当作分享。

关于匹配字符串问题,有很多种类型,今天讨论 js 代码里的字符串匹配。(因为我想学完之后写个语法高亮练手,所以用js代码当作例子)

复制代码 代码如下:

var str1 = "我是字符串1哦,快把我取走", str2 = "我是字符串2哦,快把我取走";

比如这样一个字符串,匹配起来很简单 /"[^"]*"/g 即可。

 



PS: 白色截图是 chrome 34 控制台中运行的结果,深灰色是 sublime text 结果。

很容易就取到内容了,可是亲,你有没有想过,js字符串里允许转义。

 

复制代码 代码如下:

var str1 = "我是字符串1哦,"快把我取走"", str2 = "我是字符串2哦,"快把我取走"";

这不是我们想要的结果,所以我们要处理下转义问题。
转义的规则是 后面跟着一个字符,所以我们用 \. 去匹配它,就有了这样的正则 /"(?:\.|[^"])*"/g

 
 
可能对于正则不熟悉的朋友,一下子从 /"[^"]*"/g 变到 /"(?:\.|[^"])*"/g 后理解不了,我简单说明下。
(?:) 是非捕获组,就是不会把内容抓取保存到内存里的。
\. 用于匹配 " ' a 之类的转义字符,匹配成功的话消耗2个字符。
[^"] 匹配除了 " 以外的所有字符,匹配成功的话消耗1个字符。
所以这个表达式的意思是,先匹配 . 这样转义,如果成功会消耗掉正确的转义,如果不成功就用 [^"] 匹配。

消耗掉正确的转义的意思是,比如 "aa\aa"aaufffaa" 都会被正常匹配,因为这些都在正常的转义。
形如 "aa\aa"aaufff\"aa" 这里的 \" 其中 \ 会被匹配,而 " 既不满足 \. 也不满足 [^"]
所以这个匹配结果会是 "aa\aa"aaufff\" 后面的 aa" 无法匹配到。


所以现在我们得到了比较强力的正则,可以有效的匹配 js 代码中的字符串了。

骚等,好像还有哪里不对。
js 字符串允许折行,形如这样:

复制代码 代码如下:

var str = "大家好
我是js";

但是这样的字符串用刚才的正则能匹配么?答案是能。
因为 不能被 \. 匹配,但是可以被 [^"] 匹配到, 后面一个字符是 r, n 或 rn (具体是什么换行符要看系统了) 都能被 [^"] 匹配到,所以我们无意间写了个强力的表达式。

现在剩下最后一个问题了,就是 ' 的匹配。
我们修改下表达式 /"(?:\.|[^"])*"|'(?:\.|[^'])*'/g 就好了。

来测试一下:

复制代码 代码如下:

var str1 = "我是字符串1哦,
"快把我取走"", str2 = '我是字符串2哦,
'快把我取走'';

匹配成功。

分享到:
使用正则表达式匹配[***]样式的字符串_正...
源码如下: 复制代码 代码如下: - (NSUInteger)analyseRX:(NSString *)string withPatternString:(NSString *)patternString{    //     \\[[^\\]]+\\]  用以匹配字符串中所出现的 [*] 的个数    //     ]+>        用以匹配字符串中所出现的 的个数    if (string == nil)    {     ...
PHP中过滤常用标签的正则表达式_正则表达...
复制代码 代码如下: $str=preg_replace("/\s+/", " ", $str); //过滤多余回车$str=preg_replace("/
  •         php迷,一个php技术的分享社区,专属您自己的技术摘抄本、收藏夹。
  • 在这里……