如何使用Selenium获取通过JavaScript渲染的HTML源代码

11 浏览2023年3月28日

匿名的 2023年3月28日

0 Comments

我在一个网页中运行了一个查询，然后得到了结果的URL。如果我右键点击查看HTML源代码，我可以看到由JS生成的HTML代码。如果我简单地使用urllib，Python无法获取JS代码。所以我看到一些使用selenium的解决方案。以下是我的代码：

from selenium import webdriver
url = 'http://www.archives.com/member/Default.aspx?_act=VitalSearchResult&lastName=Smith&state=UT&country=US&deathYear=2004&deathYearSpan=10&location=UT&activityID=9b79d578-b2a7-4665-9021-b104999cf031&RecordType=2'
driver = webdriver.PhantomJS(executable_path='C:\python27\scripts\phantomjs.exe')
driver.get(url)
print driver.page_source
>>>          显然这是不正确的！

这是我需要在右键点击窗口中的源代码（我需要的信息部分）


        jQuery(document).ready(function() {
            jQuery(".ancestry-information-tooltip").actooltip({
href: "#AncestryInformationTooltip", orientation: "bottomleft"});
        });

所以我的问题是：如何获取由JS生成的信息？

在Python中获取执行的JavaScript内容

用Python获取使用Javascript生成的页面

将一个包含HTML/JavaScript的字符串放入Selenium WebDriver中

使用Python进行Web-scraping JavaScript页面

Selenium在服务器上无法像在本地机器上一样正常工作。

在Selenium中获取Javascript代码的返回值

如何从页面中获取HTML源代码?

Selenium: 如何在页面加载/执行页面的其他脚本之前注入/执行JavaScript？

Scrapy 如何处理 JavaScript

如何使用beautifulsoup获取js和Reactjs的数据？

如何使Selenium在有缓慢脚本的情况下不等待完整页面加载？

如何通过URL获取远程网站的屏幕截图？

使用scrapy来获取使用Javascript的结果的第二页。

使用Python的Requests库与JavaScript页面一起使用

如何将网页中的JSON获取到Python脚本中

如何获取完全计算的HTML（而不是源HTML）？

使用Python在Selenium中运行JavaScript

自动读取由HTML页面上的JavaScript创建的超链接的内容。

Python html-requests render()不会渲染JavaScript元素。

使用C#中的Selenium WebDriver执行JavaScript

如何使用Selenium获取通过JavaScript渲染的HTML源代码

0 答案