V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
PEax
V2EX  ›  Python

Python 新手 爬取亚马逊的问题

  •  
  •   PEax · 2022-07-29 18:02:11 +08:00 · 2392 次点击
    这是一个创建于 608 天前的主题,其中的信息可能已经有所发展或是发生改变。

    连贯的操作一直提醒没有 cookie

    比如访问登录页,然后再模拟点击登录

    像这种操作场景,如果不用 selenium 能不能实现呢?

    感觉用 selenium 太重了

    8 条回复    2022-08-02 16:24:55 +08:00
    PEax
        1
    PEax  
    OP
       2022-07-29 18:09:11 +08:00
    。。。太难了,比如反页也是,下一页就不行。。。
    westoy
        2
    westoy  
       2022-07-29 18:32:42 +08:00
    新手就别试亚马逊了.......亚马逊风控很难过的, 而且经常会调整, 就算你读到数据了, 也有可能是它针对恶意爬虫吐的假数据......
    jdi
        3
    jdi  
       2022-07-29 18:36:38 +08:00
    新手,亚马逊。放弃吧,挫败感还能少点
    qwq11
        4
    qwq11  
       2022-07-29 23:23:38 +08:00
    确定发送了 cookie 吗,还有 header 呢,确定不了问题可以打断点看,不然就抓包抓一下,看看请求对不对
    wersonliu9527
        5
    wersonliu9527  
       2022-07-30 11:52:57 +08:00
    2019 年搞过亚马逊整站,那时候好像容易点,现在不知道啥情况了
    guchengzhihuan
        6
    guchengzhihuan  
       2022-08-01 10:22:27 +08:00
    换个思路,半自动爬虫不香吗?
    heartlocker
        7
    heartlocker  
       2022-08-02 16:18:55 +08:00
    你可以用 Clicknium 试试?
    heartlocker
        8
    heartlocker  
       2022-08-02 16:24:55 +08:00
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1388 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 17:32 · PVG 01:32 · LAX 10:32 · JFK 13:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.