想通过采集代理ip来做代理ip池,通过大量的Ip提高seo效果,习惯了正则处理,但是今天有时间测试下queryList,毕竟工欲善其事必先利其器。
// 保存全部的代理IP $allProxy = []; // 循环爬取数据 for ($i = 0; $i < 10; $i++) { // 页码 $page = $i + 1; // 请求地址 $url = 'https://proxy.ip3366.net/free/?action=china&page=' . $page; // 定义采集规则 $rules = [ 'ip' => ['td[data-title=IP]', 'text'], 'port' => ['td[data-title=PORT]', 'text'], 'type' => ['td[data-title=类型]', 'text'], ]; // 循环的dom主体 $range = 'tbody tr'; $rt = QueryList::get($url)->rules($rules)->range($range)->query()->getData(); foreach ($rt->all() as $ip) { $allProxy[$ip['ip']] = $ip; } // 休息1秒 //sleep(1); }
<?php //高先生简单验证码. //随机数 //为什么循环0-15的数字 //因为要实现最简单的字母和数字混搭 //16进制0-9 a-f //dechex 十进制转换为16进制 //创建一个四位的验证码. //$nmsg.  ...
001源码:/* * $xml_str是xml字符串 */ function xmltoarray($xml_str) { //禁止XML实体扩展攻击 libxml_disable_entity_loader(true); //拒绝包含...
php arrayaccess 官方的说法是让你能以数组的形式访问对象,对于这种php内置接口一直不太明白有什么用,坚持多看文章,终于理解,特来分享,思路不同,更易于理解。(1).创建一个学生类,并且实现arrayaccess 接口。<?php class studen...
(1).前端文件:<form action="upload.php" method="post" enctype="multipart/form-data"> &...
参数中包含gb2312的字符串,返回结果是false或者null(不同PHP版本具有差异性)代码:<?php $dbms = 'mysql'; $host = '192.168.8.8'; $dbName =&n...
在编写多进程的实例中我在每个进程中使用如下代码://调用等待信号的处理器 while (true) { pcntl_signal_dispatch(); }开启5个进程,cpu直接100%修正之后的代码://调用等待信号的处理器 while&...