如何使用node.js抓取包含动态内容的页面?

10 浏览
0 Comments

如何使用node.js抓取包含动态内容的页面?

我正在尝试爬取一个网站,但是有一些元素无法获取,因为这些元素是动态创建的。

我在node.js中使用cheerio库,我的代码如下:

var request = require('request');
var cheerio = require('cheerio');
var url = "http://www.bdtong.co.kr/index.php?c_category=C02";
request(url, function (err, res, html) {
    var $ = cheerio.load(html);
    $('.listMain > li').each(function () {
        console.log($(this).find('a').attr('href'));
    });
});

这段代码返回一个空响应,因为当页面加载时,

    是空的。

    内容还没有被添加进去。

    我该如何使用node.js获取这些元素?我该如何爬取具有动态内容的页面?

0