调用php curl多线程实现原理与实例详解

php多线程  时间:2021-01-31  阅读:()

PHP Curl多线程实现原理与实例详解因为工作中我们经常会需要使用到Curl多线程来处理一些事情,不得己就深入了对Curl多线程研究了,下面小编来给各位同学介绍一下Curl多线程实例与原理吧.

相信许多人对php手册中语焉不详的curl_mult i一族的函数头疼不已,它们文档少,给的例子更是简单的让你无从借鉴,我也曾经找了许多网页,都没见一个完整的应用例子。

1. curl_multi_add_handle

2. curl_multi_close

3. curl_multi_exec

4. curl_multi_getcontent

5. curl_multi_info_read

6. curl_multi_init

7. curl_multi_remove_handle

8. curl_multi_select

一般来说,想到要用这些函数时,目的显然应该是要同时请求多个url,而不是一个一个依次请求,否则不如自己循环去调curl_exec好了.

步骤总结如下

第一步调用curl_multi_init

第二步循环调用curl_multi_add_handle,这一步需要注意的是curl_multi_add_handle的第二个参数是由curl_init而来的子handle。第三步持续调用curl_multi_exec

第四步根据需要循环调用curl_multi_getcontent获取结果

第五步调用curl_multi_remove_handle并为每个字handle调用curl_close第六步调用curl_multi_close

这里有PHP手册上的例子,代码如下:

1. <?php

2. //创建一对cURL资源

3. $ch1 = curl_init() ;

4. $ch2 = curl_init() ;

5.

6. //设置URL和相应的选项

7. curl_setopt($ch1, CURLOPT_URL, "http://lxr.php.net/") ;

8. curl_setopt($ch1, CURLOPT_HEADER, 0) ;

9. curl_setopt($ch2, CURLOPT_URL, "http://www.php.net/") ;

10.curl_setopt($ch2, CURLOPT_HEADER, 0) ;

11.

12.//创建批处理cURL句柄

13. $mh = curl_multi_init() ;

14.

15.//增加2个句柄

16.curl_multi_add_handle($mh, $ch1) ;

17.curl_multi_add_handle($mh, $ch2) ;

18.

19. $active = null;

20.//执行批处理句柄

21.do {

22. $mrc = curl_multi_exec($mh, $active) ;

23. } whi le ($mrc == CURLM_CALL_MULTI_PERFORM) ;

24.

25.whi le ($active && $mrc == CURLM_OK) {

26. if (curl_multi_select($mh) != -1) {

27. do {

28. $mrc = curl_multi_exec($mh, $active) ;

29. } whi le ($mrc == CURLM_CALL_MULTI_PERFORM) ;

30. }

31. }

32.//关闭全部句柄

33.curl_multi_remove_handle($mh, $ch1) ;

34.curl_multi_remove_handle($mh, $ch2) ;

35.curl_multi_close($mh) ;

36.?>

整个使用过程差不多就是这样,但是,这个简单代码有个致命弱点,就是在do循环的那段,在整个url请求期间是个死循环,它会轻易导致CPU占用100%。现在我们来改进它,这里要用到一个几乎没有任何文档的函数curl_multi_select了,虽然C的curl库对select有说明,但是,php里的接口和用法确与C中有不同。

把上面do的那段改成下面这样,实例代码如下:

1. do {

2. $mrc = curl_multi_exec($mh, $active) ;

3. } whi le ($mrc == CURLM_CALL_MULTI_PERFOR

M) ;

4. while ($active and $mrc == CURLM_OK) {

5. if (curl_multi_select($mh) != -1)

{

6. do {

7. $mrc = curl_multi

_exec($mh, $active) ;

8. } whi le ($mrc == CURLM_C

ALL_MULTI_PERFORM) ;

9. }

10. }

因为$active要等全部url数据接受完毕才变成false,所以这里用到了curl_multi_exec的返回值判断是否还有数据,当有数据的时候就不停调用curl_multi_exec,暂时没有数据就进入select阶段,新数据一来就可以被唤醒继续执行,这里的好处就是CPU的无谓消耗没有了。

另外:还有一些细节的地方可能有时候要遇到

控制每一个请求的超时时间,在curl_multi_add_handle之前通过curl_setopt去做curl_setopt($ch, CURLOPT_TIMEOUT, $timeout) ;

判断是否超时了或者其他错误,在curl_multi_getcontent之前用curl_error($conn[$i] ) ;

本类的特点,运行非常稳定。

设置一个并发就会始终以这个并发数进行工作即使通过回调函数添加任务也不影响。

CPU占用极低绝大部分CPU消耗在用户的回调函数上。

内存利用率高任务数量较多15W个任务占用内存会超过256M可以使用回调函数添加任务个数自定。

能够最大限度的占用带宽。

链式任务,比如一个任务需要从多个不同的地址采集数据,可以通过回调一气呵成。

能够对CURL错误进行多次尝试次数自定大并发一开始容易产生CURL错误网络状况或对方服务器稳定性也有可能产生CURL错误 。

回调函数相当灵活可以多种类型任务同时进行比如下载文件抓取网页分析404可以在一个PHP进程中同时进行 。

可以非常容易的定制任务类型 比如检查404获取redirect的最后url等。可以设置缓存挑战产品节操。

不足:不能充分利用多核CPU(可以开多个进程解决,需要自己处理任务分割等逻辑) 。

最大并发500(或512 ) ,经过测试是CURL内部限制,超过最大并发会导致总是返回失败。

目前没有断点续传功能,目前任务是原子性的,不能对一个大文件分为几部分分别开线程下载.

华纳云不限流量¥324/年,香港双向CN2(GIA)云服务器/1核1G/50G存储/2Mbps

华纳云(HNCloud Limited)是一家专业的全球数据中心基础服务提供商,总部在香港,隶属于香港联合通讯国际有限公司,拥有香港政府颁发的商业登记证明,保证用户的安全性和合规性。 华纳云是APNIC 和 ARIN 会员单位。主要提供香港和美国机房的VPS云服务器和独立服务器。商家支持支付宝、网银、Paypal付款。华纳云主要面向国内用户群,所以线路质量还是不错的,客户使用体验总体反响还是比较好...

TmhHost 全场八折优惠且充值返10% 多款CN2线路

TmhHost 商家是一家成立于2019年的国人主机品牌。目前主营的是美国VPS以及美国、香港、韩国、菲律宾的独立服务器等,其中VPS业务涵盖香港CN2、香港NTT、美国CN2回程高防、美国CN2 GIA、日本软银、韩国cn2等,均为亚太中国直连优质线路,TmhHost提供全中文界面,支持支付宝付款。 TmhHost黑五优惠活动发布了,全场云服务器、独立服务器提供8折,另有充值返现、特价服务器促销...

美国云服务器 2核4G限量 24元/月 香港云服务器 2核4G限量 24元/月 妮妮云

妮妮云的来历妮妮云是 789 陈总 张总 三方共同投资建立的网站 本着“良心 便宜 稳定”的初衷 为小白用户避免被坑妮妮云的市场定位妮妮云主要代理市场稳定速度的云服务器产品,避免新手购买云服务器的时候众多商家不知道如何选择,妮妮云就帮你选择好了产品,无需承担购买风险,不用担心出现被跑路 被诈骗的情况。妮妮云的售后保证妮妮云退款 通过于合作商的友好协商,云服务器提供2天内全额退款到网站余额,超过2天...

php多线程为你推荐
聚酯纤维和棉哪个好袜子是棉的好还是聚酯纤维的好?输入法哪个好用手机拼音输入法哪个好用华为p40和mate30哪个好荣耀30pro和华为p40对比。,哪个更值得入手?压缩软件哪个好解压软件哪个好压缩软件哪个好安卓手机哪一款解压缩软件比较好用?谢谢!手动挡和自动挡哪个好自动挡和手动挡哪个更好一点杰士邦和杜蕾斯哪个好杰士邦和杜蕾斯哪个好?大家都用哪款套套啊?手机管家哪个好最好的手机管家手机杀毒哪个好手机杀毒软件哪个最好用网络机顶盒哪个好现在用什么网络机顶盒最好?
国际域名抢注 香港vps 域名服务器上存放着internet主机的 免费动态域名 京东商城双十一活动 e蜗牛 北京双线机房 100mbps Updog lick 主机管理系统 免费的域名 论坛主机 云服务器比较 114dns 阿里云邮箱登陆 创速 大化网 闪讯网 windowsserver2008r2 更多