我找不到好的基于Java的网页抓取API。我需要抓取的网站也没有提供任何API;我想使用某个pageID来遍历所有网页,并提取它们DOM树中的HTML标题/其他内容。
pageID
除了网页抓取以外,还有其他方法吗?
用户名或电子邮箱地址
密码