php专区

 首页 > php专区 > 正则表达式 > php 正则表达式提取网页超级链接url的函数_正则表

php 正则表达式提取网页超级链接url的函数_正则表

分享到:
【字体:
导读:
          php 正则表达式提取网页超级链接url的函数...

复制代码 代码如下:

function match_links($document) {
preg_match_all("']+))[^>]*>?(.*?)'isx",$document,$links);
while(list($key,$val) = each($links[2])) {
if(!empty($val))
$match['link'][] = $val;
}
while(list($key,$val) = each($links[3])) {
if(!empty($val))
$match['link'][] = $val;
}
while(list($key,$val) = each($links[4])) {
if(!empty($val))
$match['content'][] = $val;
}
while(list($key,$val) = each($links[0])) {
if(!empty($val))
$match['all'][] = $val;
}
return $match;
}

主要是正则的问题,下面给出个asp.net下的,多测试正则
获取页面的链接正则
复制代码 代码如下:

public string GetHref(string HtmlCode)
{
string MatchVale = "";
string Reg = @"(h|H)(r|R)(e|E)(f|F) *= *('|"")?((w|\|/|.|:|-|_)+)('|""| *|>)?";
foreach (Match m in Regex.Matches(HtmlCode, Reg))
{
MatchVale += (m.Value).ToLower().Replace("href=", "").Trim() + "||";
}
return MatchVale;
}
分享到:
ASP超级链接和HTML函数正则表达式 修正版...
过滤超级链接 复制代码 代码如下: Function RegRemoveHref(HTMLstr) Set ra = New RegExp ra.IgnoreCase = True ra.Global = True ra.Pattern = "]+>(.+?)" RegRemoveHref = ra.replace(HTMLstr,"$1") END Function 过滤所有HTML代码 复制代码 代码如下: Function RemoveHTML(strHTML) Dim objRegExp, Match, Matches...
javascript 基于正则表达式的文本框验证...
1,不能为空 2,只能输入英文和数字 3,判断字符由字母和数字,下划线,点号组成.且开头的只能是下划线和字母 /^([a-zA-z_]{1})([\w]*)$/g.test(str) 4,只能输入数字 5,只能输入中文 6,只能输入英文 7,只能输入中文、英文、数字、@符号和.符号 8,只允许输入英文,且不能粘贴也无法弹出粘贴菜单 只能输入数字和...
  •         php迷,一个php技术的分享社区,专属您自己的技术摘抄本、收藏夹。
  • 在这里……