当前位置:首页 > PHP > 正文内容

php爬虫执行js,php执行js

高老师6年前 (2020-01-07)PHP2408

当我们使用php爬虫采集网站时经常会遇到内容使用ajax异步加载。一般采取的方案是PHP模拟再请求api接口获取数据,但是有时候前端js加密非常麻烦,我们需要将js的加密方法转换为php方法方便curl请求。当然通过了解我们可以通过3种方案解决。

第一种:使用phpv8js扩展执行js代码。(pecl自行下载安装,windows安装方法http://www.yuzhiwei.com.cn/archives/238.html/comment-page-1)

<?php
//初始化
$v8 = new V8Js();

//js代码
$js = "
    var char = 'abcdef';
    var password = '123456';
    function sign(char,password)
    {
        return char+password;
    }
    var token = sign(char,password);
    token;
";

//尝试执行js
try
{
    $ret = $v8->executeString($js, 'auth.js');
    echo '执行成功:' . PHP_EOL;
    var_dump($ret);
}
catch (Exception $e)
{
    echo '代码异常' . PHP_EOL;
    var_dump($e->getMessage());
}

输出:abcdef123456

第二种:使用phantomjs加载网页,phantomjs软件内置一款webkit内核的浏览器,通过php的api调用完成真正的模拟访问,等待页面加载完成提取dom即可。(安装方法自行百度)

扫描二维码推送至手机访问。

版权声明:本文由高久峰个人博客发布,如需转载请注明出处。

本文链接:https://blog.20230611.cn/post/115.html

分享给朋友:

“php爬虫执行js,php执行js” 的相关文章

PHP携带COOKIE登录,PHP模拟登陆

PHP携带COOKIE登录,PHP模拟登陆

    这里给出的是Demo,事实上正式的网站对HTTP请求头要求完整性非常严格,建议完善请求头.    1.先看验证文件:<?php if($_COOKIE['username']=='a...

PHP跨域问题最佳解决方案

PHP跨域问题最佳解决方案

1、允许单个域名访问指定某域名(http://client.runoob.com)跨域访问,则只需在http://server.runoob.com/server.php文件头部添加如下代码:header('Access-Control-Allow-Origin:http://client....

 php监听事件,php触发事件

php监听事件,php触发事件

逛公众号文章看到文章"php实现事件监听与触发的方法,你用过吗?",我就好奇了,php又不是asp.net的webform,哪里来的服务端事件监听。于是学习了一波。先看下监听类:class Event {     /** &nbs...

php限制方法返回值类型

php限制方法返回值类型

php7新增的特性(1).强制限制只能返回一种类型<?php class task { } //must return an integer function add(): int {    &nb...

PHP最快方式模拟curl,PHP最快爬虫模拟方法

PHP最快方式模拟curl,PHP最快爬虫模拟方法

有时候我们需要爬一个接口,但是这个接口需要很多参数,包括header和cookie要去编写,使用php curl模拟实在太慢。我们可以通过浏览器的network来复制请求为curl命令。例如我需要模拟请求接口地址:https://www.xkmz.cc/Ajax/Debug/delly,我们只需要在...

thinkphp3定时任务,tp定时任务,thinkphp定时任务

thinkphp3定时任务,tp定时任务,thinkphp定时任务

本教程使用的定时任务基于EasyTak,EasyTask官方文档:https://gitee.com/392223903/EasyTask由于tp3.2.x官方开发未考虑命令行支持和绝对路径开发的标准,因此我编写了一个支持的类来运行。1.在tp3.2.3根目录下安装easytaskcomposer&...