php专区

 首页 > php专区 > PHP应用 > 常用功能 > php file_get_contents 设置代理抓取页面示例 - php高级

php file_get_contents 设置代理抓取页面示例 - php高级

分享到:
【字体:
导读:
          file_get_contents函数在php中可以直接打开本地文件也可以直接抓取远程服务器文件,如果简单的采集我们可以使用file_get_contents直接来操作,如果有防采集我们可能需要代理来操作,下面我来介...

php file_get_contents 设置代理抓取页面示例

file_get_contents函数在php中可以直接打开本地文件也可以直接抓取远程服务器文件,如果简单的采集我们可以使用file_get_contents直接来操作,如果有防采集我们可能需要代理来操作,下面我来介绍file_get_contents抓取页面示例.

例1,普通页面获取

例如,访问54master论坛,想抓取首页里 所有h3标记内的元素,代码如下:

  1. $url=http://www.phpfensi.com; 
  2. $contents=@file_get_contents($url); 
  3. //preg_match_all("/(.*?)

    /is",$contents,$content);
     
  4. preg_match_all("/

    (.*?)

    /is"
    ,$contents,$content); 
  5. print_r($content[0]); 

例2,设置代码IP去采集数据

使用file_get_contents 和 stream_context_create 即可,代码如下:

  1. $aContext = array(  
  2.     'http' => array(  
  3.         'proxy' => 'tcp://192.168.0.2:3128',  //这里设置你要使用的代理ip及端口号  
  4.         'request_fulluri' => true,  
  5.     ),  
  6. );  
  7. $cxContext = stream_context_create($aContext);  
  8. $sFile = file_get_contents("http://www.phpfensi.com", False, $cxContext);  
  9. echo $sFile

以上代码适用于正常情况,但是如果目标页面需要登录或需要认证信息才能访问的话,可以加多一句代码,代码如下:

  1. $auth = base64_encode('LOGIN:PASSWORD');//LOGIN:PASSWORD 这里是你的账户名及密码  
  2. $aContext = array(  
  3.     'http' => array(  
  4.         'proxy' => 'tcp://192.168.0.2:3128',//这里设置你要使用的代理ip及端口号  
  5.         'request_fulluri' => true,  
  6.         'header' => "Proxy-Authorization: Basic $auth",  
  7.     ),  
  8. );  
  9. $cxContext = stream_context_create($aContext);  
  10. $sFile = file_get_contents(http://www.phpfensi.com, False, $cxContext);  
  11. echo $sFile

这样就可以使用代理来抓取页面或文件了.

分享到:
PHP中如何将ip地址转成十进制数 - php高...
PHP中如何将ip地址转成十进制数 ip地址转成十进制数是根据的公式算出来的:74×256^3+30×256^2+10×256+243 = 1243482867或者说分别将IP地址的四位数字化成十六进制,将得到的十六进制去掉\"小数点\"后再化为十进制即可. PHP 中如何将ip地址转成十进制数呢?现在PHP中有很多时候都会用到ip地...
PHP网址缩短代码(生成短网址) - php高级...
PHP网址缩短代码(生成短网址) 每个网址用6个字符代替,(32^6) 最多可以拥有1,073,741,824个短网址,当然,你还可以记录更详细的信息,如访问记录,创建时间等,如果真不够用了,还可以删掉很久不用的,代码如下: function shorturl($input) {    $base32 = array (      &#03...
  •         php迷,一个php技术的分享社区,专属您自己的技术摘抄本、收藏夹。
  • 在这里……