15
2013-04

php抓取函数file_get_contents()和curl()

file_get_contents和curl函数用法
想做山寨搜索引擎的朋友别错过了哦!
PHP采集(小偷)程序必用的函数,用于远程获取页面的源代码,然后再经过正则处理,获取需要采集的 内容……更为详细的,请查询PHP手册:
file_get_contents ()应用很简单,但是有的服务器php.ini设置如果关闭allow_url_fopen,这个函数就失效了,一般个人服务器可以设置,但是如果是虚拟 主机就不在自己掌控范围内了。但是curl 是另外一个打开远程页面的内容的函数用法如下:
以下为引用的 内容:

<?php
// create a new curl resource
$ch = curl_init();
// set URL and other appropriate options
curl_setopt($ch, CURLOPT_URL, "http://www.shiyayong.cn/");
curl_setopt($ch, CURLOPT_HEADER, 0);
// grab URL and pass it to the browser
curl_exec($ch);
// close curl resource, and free up system resources
curl_close($ch);
?>

当然此功能也有被关闭的可能。
使用以上2个方法可以使用function_exists()判断使用
以下为引用的 内容:

if(function_exists('file_get_contents')) {
$file_contents = file_get_contents($url);
} else {
$ch = curl_init();
$timeout = 5;
curl_setopt ($ch, CURLOPT_URL, $url);
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
$file_contents = curl_exec($ch);
curl_close($ch);
}
return $file_contents;



除非注明,文章均为史亚永原创,欢迎转载!转载请注明本文地址,谢谢。

本文地址:http://www.shiyayong.cn/post/file_get_contents.html

评论列表:

1  多米网  2013-4-24 23:47:44 回复该留言  IP:49.119.151.103
这个函数我用的比较少,今天偶然碰到,算是学习了。
  茶馆老板  2013-4-25 20:46:23 回复该留言  IP:117.79.232.202
可以获得你想要的信息,很不错的,很实用的啊
茶馆老板
多米网

发表评论:

(设置个性头像)

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

无觅相关文章插件,快速提升流量