当前位置:首页 > PHP > 正文内容

phpQuery,php爬虫类库,像jQuery一样轻松采集内容

高老师4年前 (2020-10-10)PHP2197

phpquery能使得php操作html字符串像jquery一样简单,但是phpquery官方好像没有维护了,我们引入包使用querylist的依赖包,因为它是一直在单独github维护的

github地址:

https://github.com/jae-jae/phpQuery-single

(1).安装包

composer require jaeger/phpquery-single

(2).使用

$html = <<<STR
<div id="one">
    <div class="two">
        <a href="http://querylist.cc">QueryList官网</a>
        <img src="http://querylist.cc/1.jpg" alt="这是图片">
        <img src="http://querylist.cc/2.jpg" alt="这是图片2">
    </div>
    <span>其它的<b>一些</b>文本</span>
</div>        
STR;

$doc = phpQuery::newDocumentHTML($html);

$src = $doc->find('.two img:eq(0)')->attr('src');

echo $src;
// http://querylist.cc/1.jpg

尽量不要再去单独下载文件,或者可以从phpquery官网进行下载:

http://code.google.com/p/phpquery/

可能需要翻墙并单独引入

其他的操作方法可以百度phpquery 的实例进行使用

扫描二维码推送至手机访问。

版权声明:本文由高久峰个人博客发布,如需转载请注明出处。

本文链接:https://blog.20230611.cn/post/166.html

分享给朋友:

“phpQuery,php爬虫类库,像jQuery一样轻松采集内容” 的相关文章

PHP计算两个字符串的相似度

PHP计算两个字符串的相似度

<?php echo similar_text("Hello World","Hello Shanghai"); ?> 2.计算两个字符串的相似度,并返回百分比 <?php similar_text("...

php守护进程

php守护进程

<?php /**  * daemonize让当前脚本为守护进程执行  * @param string $callback 匿名函数  */ function daemonize($callback) {...

pcntl_signal(): Error assigning signal

pcntl_signal(): Error assigning signal

当我想在一个进程中监听kill 和 kill -9命令报了这个错误。//监听kill pcntl_signal(SIGTERM, function () {     posix_kill(0, SIGTERM); });...

PHP最快方式模拟curl,PHP最快爬虫模拟方法

PHP最快方式模拟curl,PHP最快爬虫模拟方法

有时候我们需要爬一个接口,但是这个接口需要很多参数,包括header和cookie要去编写,使用php curl模拟实在太慢。我们可以通过浏览器的network来复制请求为curl命令。例如我需要模拟请求接口地址:https://www.xkmz.cc/Ajax/Debug/delly,我们只需要在...

mysql悲观锁,mysql乐观锁,mysql乐观锁怎么实现,mysql update 乐观锁

mysql悲观锁,mysql乐观锁,mysql乐观锁怎么实现,mysql update 乐观锁

【一】.无锁场景:多个人购买一件商品,库存减少。商品表:主键   商品名   库存数量 id     name     stock 1&nb...

No releases available for package,pecl 安装扩展提示No releases available for package

No releases available for package,pecl 安装扩展提示No releases available for package

安装php-redis扩展提示No releases available for package我直接去php官网下载redis扩展.tgz文件,然后直接用pecl安装本地文件pecl install  ./redis.tgz...