V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
goodluck
V2EX  ›  问与答

求新浪微博爬虫怎么不被封号。。。

  •  
  •   goodluck · 2016-04-14 10:20:33 +08:00 · 6463 次点击
    这是一个创建于 3170 天前的主题,其中的信息可能已经有所发展或是发生改变。

    这几天抓取新浪微博,每个请求随机一个代理,每半小时换一个账号,过了几个小时,立马几十个账号被冻结。很郁闷。。。有高手知道怎么对付新浪微博的反爬虫么?

    6 条回复    2018-05-08 23:11:11 +08:00
    maowu
        1
    maowu  
       2016-04-14 10:56:53 +08:00 via Android
    不懂爬虫,不过每个请求随机一个代理会不会太频繁了
    cdwyd
        2
    cdwyd  
       2016-04-14 11:01:08 +08:00
    哪一个正常用户的 IP 会一直变来边去的,这也太明显了。
    JJaicmkmy
        3
    JJaicmkmy  
       2016-04-14 11:41:33 +08:00 via iPad
    每一次换账号时换代理,同一个账号不要用不同的代理。
    Xrong
        4
    Xrong  
       2016-04-14 13:03:33 +08:00
    频率别开太高,基本没啥事,好奇楼主的登录是 cookies 式的么?
    goodluck
        5
    goodluck  
    OP
       2016-04-14 13:15:58 +08:00
    是的,我是用 cookie 登陆的。先备份几十个 cookie 。。。淘宝一元 5 个账号。
    p1094358629
        6
    p1094358629  
       2018-05-08 23:11:11 +08:00
    账号用来干嘛??
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2553 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 00:02 · PVG 08:02 · LAX 16:02 · JFK 19:02
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.