这是一个创建于 2561 天前的主题,其中的信息可能已经有所发展或是发生改变。
RT。想抓去的内容在
<p class=\"comment_txt\" node-type=\"feed_list_content\" nick-name=\"\u5927\u8fde\u65e5\u62a5\">\n\t\t<a class=\"a_topic W_linkb\" href=\"http:\/\/huati.weibo.com\/k\/%E4%BC%98%E5%8C%96%E5%A4%A7%E8%BF%9E%E8%90%A5%E5%95%86%E7%8E%AF%E5%A2%83+%E7%9C%8Bta%E5%81%9A%E5%95%A5%E8%B4%A1%E7%8C%AE?from=526\"suda-data=\"key=tblog_search_weibo&value=weibo_feed_topic\" target=\"_blank\">
里面,如何提取?求大大指步
3 条回复 • 2017-06-14 21:57:29 +08:00
|
|
1
Mavious 2017-06-12 13:43:09 +08:00
没有办法的,我困在网页嵌入 js (由 js 输出我想要的内容)里一筹莫展。和 LZ 遇到的、内容不直接存放在 HTML 上,是一样的情况。 我不是前端,不会分析,所以发过求分析的帖子。 被告知处理这类输出的话,对服务器有性能要求,除非自己部署在自己服务器上,否则无解的。 feed43 只能处理静态页面。
PS:我在 43 上挂了至少 30 个爬虫,虽然不是开发者,但自诩对 43 非常熟悉了。这个真真是无解的。
|
|
|
2
java 2017-06-14 12:32:14 +08:00
@ Mavious 有支持 JS 抓取的 rss 站点吗?
|
|
|
3
Mavious 2017-06-14 21:57:29 +08:00 via iPhone
|