如何选择特定元素后的所有文本节点

13 浏览
0 Comments

如何选择特定元素后的所有文本节点

HTML:

    

第一

第二
第三 第四 ...

从上述的

节点中,我想要获取


节点后的所有子文本节点("第三","第四",...可能还有更多)

如果我执行以下代码:

document.querySelectorAll('div.someclass>hr~*')

我得到的是NodeList [ br, br, em, ... ] - 没有文本节点

使用下面的代码:

document.querySelector('div.someclass').textContent

我得到的是所有文本节点组成的单个字符串

我可以通过以下代码获取每个文本节点:

var third = document.querySelector('div.someclass').childNodes[6].textContent
var fourth = document.querySelector('div.someclass').childNodes[8].textContent

所以我尝试了以下代码:

document.querySelector('div.someclass').childNodes[5:]  # SyntaxError

slice()

document.querySelector('div.someclass').childNodes.slice(5)  # TypeError

那么有没有办法可以从


节点开始获取所有子文本节点呢?

更新

我忘了提及这个问题是关于网络爬虫,而不是网络开发...我不能更改HTML源代码。

0