V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
XuAaron
V2EX  ›  Python

爬虫断网可以获取到异常吗?如果可以对应的异常是什么呢?

  •  
  •   XuAaron · 2018-06-19 15:53:58 +08:00 · 3483 次点击
    这是一个创建于 2349 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近在学习爬虫,现在想要实现一个功能:爬取链接,如果断网,就将链接保存在本地文件。现在的问题是我不是很清楚这是否可行,如果可行应该捕获的哪一种异常呢? 以下是 sm.ms 的图片外链,但图片好像不能直接显示。

    https://i.loli.net/2018/06/19/5b28b479c3591.jpg

    https://i.loli.net/2018/06/19/5b28b479bfbc0.jpg

    这两张图片是一起的,只是截图截不了所有,所以分开截取了。

    12 条回复    2018-06-20 12:50:09 +08:00
    soho176
        1
    soho176  
       2018-06-19 16:13:45 +08:00
    fuliba?
    XuAaron
        2
    XuAaron  
    OP
       2018-06-19 16:17:21 +08:00
    @soho176 是的,感觉爬图片是学爬虫的先行动力。
    d0m2o08
        3
    d0m2o08  
       2018-06-19 16:35:07 +08:00
    try:
    爬虫(url)
    except:
    记录 url 到本地文件(url)
    XuAaron
        4
    XuAaron  
    OP
       2018-06-19 17:34:12 +08:00
    @d0m2o08 这个我已经试过了,不行。提问中的图片就是已经 catch 了各种异常,但还是不起作用。
    annielong
        5
    annielong  
       2018-06-19 17:58:31 +08:00
    干嘛不分开,先把链接保存,然后统一进行下载,还有,loli 的图床联通网络竟然无法访问
    chroming
        6
    chroming  
       2018-06-19 19:49:34 +08:00 via Android
    你自己电脑上断网打个断点调试不就知道了
    soho176
        7
    soho176  
       2018-06-19 20:20:02 +08:00
    @XuAaron fuliba 这站 竟然没有被和谐。。
    aaronzjw
        8
    aaronzjw  
       2018-06-19 20:24:43 +08:00 via iPhone   ❤️ 1
    Timeout exception
    Leigg
        9
    Leigg  
       2018-06-19 22:46:03 +08:00
    XuAaron
        10
    XuAaron  
    OP
       2018-06-20 09:01:11 +08:00
    @soho176 和谐再找其他的嘛。
    XuAaron
        11
    XuAaron  
    OP
       2018-06-20 09:02:05 +08:00
    @annielong 我试了下,微博的图床可以直接显示,其他的都不行。
    SayHeya
        12
    SayHeya  
       2018-06-20 12:50:09 +08:00 via Android
    看具体是什么异常,超时还是请求返回有问题
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2856 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 09:12 · PVG 17:12 · LAX 01:12 · JFK 04:12
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.