V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
foxyier
V2EX  ›  Python

关于 pyspider 源码中 splash 的问题

  •  
  •   foxyier · 2019-01-14 10:52:18 +08:00 · 1959 次点击
    这是一个创建于 2139 天前的主题,其中的信息可能已经有所发展或是发生改变。
    最近在学习 pyspider 的源码,发现抓取数据时的参数可配置为 splash ( fetch_type="splash"), 而且也有专门的 splash_fetch 函数和 splash_fetcher.lua 脚本来运行启动 splash,可是在网上找不到相关资料, 由于现在 phantomjs 项目已经基本被弃用了, 请问这个 splash 可以在编写爬虫时直接使用么?求解
    3 条回复    2019-01-14 11:09:31 +08:00
    knightdf
        1
    knightdf  
       2019-01-14 10:57:53 +08:00
    splash 是个单独的项目,自己去它官网看吧,渲染 JS 的
    可以直接使用的,pyspider 没用过
    foxyier
        2
    foxyier  
    OP
       2019-01-14 11:00:16 +08:00
    @knightdf splash 之前用过, scrapy 也自带插件, 最近在学 pyspider,只是好奇源码中很久之前就有相关代码, 但在网上找不到相关资料。
    xanthu
        3
    xanthu  
       2019-01-14 11:09:31 +08:00 via Android
    splash 不是一个服务么?应该要配置一下才能用吧,pyspider 没用过,但我用 scrapy 是挂了个 docker 跑的,有需要 js 渲染的就通过 splash 访问
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2355 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 15:52 · PVG 23:52 · LAX 07:52 · JFK 10:52
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.