sakwu 最近的时间轴更新
sakwu

sakwu

V2EX 第 189726 号会员,加入于 2016-09-01 08:22:16 +08:00
sakwu 最近回复了
2017-12-25 09:22:36 +08:00
回复了 maliming 创建的主题 程序员 公司后缀一般在那里可以查询到相对全一些的数据?
分词,然后截取最前面那段,这样可行?
2016-11-16 22:30:00 +08:00
回复了 Nisenasdf 创建的主题 Python python requests, 记遇到的一个问题: [Errno 104] Connection reset by peer
@Nisenasdf 额我是新手, try.except 了,但是依然中止了。

for img in range(len(img_name)):
try:
img_data = request.urlopen(img_add[img], timeout=5).read()
except Exception as e:
print(img_name[img] + '下载失败' + e)
fout_img = open('images/' + img_name[img] + '.jpg', 'wb')
fout_img.write(img_data)

fout_img.close()
print(img_name[img] + '下载成功')


如果 img_add 里有一个 URL 是错误的,下载就会中断,不懂为啥
期待是这样的输出的:
img_name1 下载成功
img_name1 下载成功
img_name1 下载失败: time out
img_name1 下载成功
img_name1 下载成功
2016-11-16 00:18:15 +08:00
回复了 Nisenasdf 创建的主题 Python python requests, 记遇到的一个问题: [Errno 104] Connection reset by peer
最近在做一个类似的爬虫,遇到一个问题就系假若数据库里面有个图片 url 被屏蔽了, 404 ,怎么跳过这条 URL 或者重新下载这个图片。

我目前状况是要么卡死,设置 timeout 也是抛出异常然后就中断了,没法进去进行下载
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   983 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 61ms · UTC 19:24 · PVG 03:24 · LAX 11:24 · JFK 14:24
Developed with CodeLauncher
♥ Do have faith in what you're doing.