抓取php的curl常用的5个例子

curl_init  时间:2021-04-19  阅读:()

PHP的curl常用的5个例子curl_setopt($ch,CURLOPT_URL,http://localho st/mytest/phpinfo.phpcurl_setopt($ch,CURLOPT_HEADER,false);curl_setopt($ch,CURLOPT_RETURNTRANSFER, 1);//如果把行注掉的就会直接出$result=curl_exec($ch);curl_close($ch);

2使用代理行抓取

什要使用代理行抓取呢以google例吧 如果去抓google的数据 短 内抓的很繁的你就抓取不到了 。google你的ip地址做限制个候你可以代理重新抓。?p hp

$ch=curl_init();curl_setopt($ch,CURLOPT_URL,http://blog.51 yip.comcurl_setopt($ch,CURLOPT_HEADER,false);curl_setopt($ch,CURLOPT_RETURNTRANSFER, 1);curl_setopt($ch,CURLOPT_HTTPPROXYTUNNEL,TRUE);curl_setopt($ch,CURLOPT_PROXY, 125.21.23.6:8080);

//url_setopt($ch,CURLOPT_PROXYUSERPWD, ‘user:password’);如果要密的 加上个$result=curl_exec($ch);curl_close($ch);

3 post数据后抓取数据

独一下数据提交数据 因用curl的候很多候会有数据交互的所以比重要的。?p hp

$ch=curl_init();

/*在里需要注意的是要提交的数据不能是二数或者更高

*例如array(‘name’=s erializ e(array(‘tank’,’zhang’)),’s ex’=1,’b irth’=‘20101010’)

*例如array(‘name’=array(‘tank’,’zhang’),’s ex’=1,’b irth’=‘20101010’) 会 的*/

$data=array(‘name’=‘te st’,’s ex’=1,’b irth’=‘20101010’);curl_setopt($ch,CURLOPT_URL,’http://localho st/mytest/curl/upload.php’);curl_setopt($ch,CURLOPT_POST, 1);curl_setopt($ch,CURLOPT_POSTFIELDS,$data);curl_exec($ch);

在upload.php文件中 print_r($_PO ST);利用curl就能抓取出upload.php 出的内容Array( [name]=te st [s ex]=1 [b irth]=20101010)

4抓取一些有面 控制的面

以前写一篇 面 控制的3 方法有趣的可以看一下。

如果用上面提到的方法抓的会以下

You are not authorized to view this page

Youdonot have permission to view this directoryorpage using the credentials that you suppliedbecause your Web browser is sending a WWW-Authenticate header field that the Web server isnot configured to accept.

个候 我就要用CURLOPT_USERPWD来行 了

?p hp

$ch=curl_init();curl_setopt($ch,CURLOPT_URL,http://club-china

/*CURLOPT_USERPWD主要用来破解面 控制的

*例如平我所以htpasswd生面控制等。*/

//curl_setopt($ch,CURLOPT_USERPWD, ‘231144:2091 XTAjmd=‘);curl_setopt($ch,CURLOPT_HTTPGET, 1);curl_setopt($ch,CURLOPT_REFERER,http://club-chinacurl_setopt($ch,CURLOPT_HEADER,0);

$result=curl_exec($ch);curl_close($ch);

5模登到s ina

我要抓取数据 可能是登以后的内容 个候我就要用到curl的模登功能了 。?p hpfunctionchecklogin($user,$password)if(emptyempty($user) | |emptyempty($password) )return0;

$ch=curl_init( );curl_setopt($ch,CURLOPT_REFERER,http://mail.sina.com.cn/index.htmlcurl_setopt($ch,CURLOPT_HEADER, true);curl_setopt($ch,CURLOPT_RETURNTRANSFER, true);curl_setopt($ch,CURLOPT_USERAGENT,USERAGENT);curl_setopt($ch,CURLOPT_COOKIEJAR,COOKIEJAR);curl_setopt($ch,CURLOPT_TIMEOUT,TIMEOUT);curl_setopt($ch,CURLOPT_URL,http://mail.sina.com.cn/cgi-bin/login.cgicurl_setopt($ch,CURLOPT_POST, true);curl_setopt($ch, CURLOPT_POSTFIELDS, logintype=uid u= .urlencode($user). psw= .$password);

$contents=curl_exec($ch);curl_close($ch);if( !preg_match(/Location: (.*)\\/cgi\\/index\\.php\\?check_time=(.*)\n/ ,$contents,$matches) )return0;

}else{

return 1;define(USERAGENT,$_SERVER[‘HTTP_USER_AGENT’] );define(COOKIEJAR, tempnam(/tmp,cookie) );define(TIMEOUT,500);echochecklogin(zhangying215,xtaj 227

打/tmp下面的co okie文件看一下

#Netscape HTTP Cookie File

#http://curl.haxx.s e/rfc/cookie_spec.html

#This file was generated by libcurl!Edit at your own risk.mail.sina.com.cn FALSE / FALSE 0 SINAMAIL-WEBFACE-SESSID65223c4bd8900284ed463d2a3e1 ac182

#HttpOnly_.sina.com.cn TRUE / FALSE 0 SUE es%3D8d96db0820c6c79922ad57d422f575e8%26ev

%3Dv0%26es2%3Dcddfb8400dc5ca95902367ddcd7f57dd

.sina.com.cn TRUE / FALSE 0 SUP cv%3D1%26bt%3D1286900433%26et%3D1286986833%26lt%3D1%26uid%3D1445632344%26user%3D%25E5%25BC

%25A0%25E6%2598%25A02001%26ag%3D2%26name%3Dzhangying20015%2540sina.com%26nick%3D%25E5%25BC%25A0%25E6%2598%25A02001%26sex%3D1%26ps

%3D0%26email%3Dzhangying20015%2540sina.com%26dob%3D 1982-07-18

#HttpOnly_.sina.com.cn TRUE / FALSE 0 SID BihcallomxMx-QZxzGrOlcSQx%2F0B%2F0cmr.NyQ%2F0B%2FcmGGalmarlmcHrcGl Smrmxmfxal_CBZ

%2F_afugCmmGirBYHm0Bc%40fr5ciZiGG5i

#HttpOnly_.sina.com.cn TRUE/FALSE 0 SPRIAL bfb4102951 fd5892a3fd5b42d442cd26#HttpOnly_.sina.com.cn TRUE/FALSE 0 SINA_USER%D5%C5%D2001

企鹅小屋6折年付240元起,美国CN2 GIA VPS促销,独享CPU,三网回程CN2 GIA

企鹅小屋怎么样?企鹅小屋最近针对自己的美国cn2 gia套餐推出了2个优惠码:月付7折和年付6折,独享CPU,100%性能,三网回程CN2 GIA网络,100Mbps峰值带宽,用完优惠码1G内存套餐是年付240元,线路方面三网回程CN2 GIA。如果新购IP不能正常使用,请在开通时间60分钟内工单VPS技术部门更换正常IP;特价主机不支持退款。点击进入:企鹅小屋官网地址企鹅小屋优惠码:年付6折优惠...

Ftech:越南vps,2核/2G/20G SSD/1Gbps不限流量/可安装Windows系统,$12.5月

ftech怎么样?ftech是一家越南本土的主机商,成立于2011年,比较低调,国内知道的人比较少。FTECH.VN以极低的成本提供高质量服务的领先提供商之一。主营虚拟主机、VPS、独立服务器、域名等传统的IDC业务,数据中心分布在河内和胡志明市。其中,VPS提供1G的共享带宽,且不限流量,还可以安装Windows server2003/2008的系统。Ftech支持信用卡、Paypal等付款,但...

无忧云:服务器100G高防云服务器,bgpBGP云,洛阳BGP云服务器2核2G仅38.4元/月起

无忧云怎么样?无忧云值不值得购买?无忧云,无忧云是一家成立于2017年的老牌商家旗下的服务器销售品牌,现由深圳市云上无忧网络科技有限公司运营,是正规持证IDC/ISP/IRCS商家,主要销售国内、中国香港、国外服务器产品,线路有腾讯云国外线路、自营香港CN2线路等,都是中国大陆直连线路,非常适合免备案建站业务需求和各种负载较高的项目,同时国内服务器也有多个BGP以及高防节点。目前,四川雅安机房,4...

curl_init为你推荐
党建搜狗浏览器2路由器itunespqqgraph支持ipad支持ipad支持ipadtcpip上的netbios网络连接详细信息上的netbios over tcpip是什么意思?重庆电信网速测试如何测量网速icloudiphone苹果6显示已停用请连接itunes什么意思迅雷下载速度为什么 迅雷下载速度太慢
动态域名解析 免费域名注册网站 免费申请域名和空间 服务器评测 踢楼 site5 主机 美国翻墙 国外空间服务商 网站监控 青果网 网通服务器ip 三拼域名 双拼域名 699美元 isp服务商 linux服务器维护 美国网站服务器 如何用qq邮箱发邮件 息壤代理 更多