首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
V2EX  ›  问与答

用 Python 写一个爬虫,爬取视频资源并保存,视频按分类存放在硬盘上,目录创建失败致无法保存

  •  
  •   abusizhishen · 2017-12-23 13:11:32 +08:00 · 1579 次点击
    这是一个创建于 388 天前的主题,其中的信息可能已经有所发展或是发生改变。

    部分分类名称含有特殊字符、导致创建目录出错。有什么好用的模块或方法能检测并修正目录吗?

    11 回复  |  直到 2017-12-24 14:16:40 +08:00
        1
    lishunan246   2017-12-23 13:13:11 +08:00   ♥ 1
    slugify
        2
    abusizhishen   2017-12-23 13:14:51 +08:00
    创建目录之前检测一遍,有特殊字符就替换或者去掉,再去创建目录
        3
    Kilerd   2017-12-23 13:44:36 +08:00
    md5(name) 满分答案
        4
    Kilerd   2017-12-23 13:45:11 +08:00
    然后用一个 sqlite 数据库记住 名字 => md5 目录的对应关系
        5
    abusizhishen   2017-12-23 13:59:52 +08:00 via Android
    @lishunan246 一会看下
        6
    abusizhishen   2017-12-23 14:03:01 +08:00 via Android
    @Kilerd 复杂了,我保存在本地,直接浏览的
        7
    lniwn   2017-12-23 14:15:45 +08:00 via iPhone
    @abusizhishen 先创建目录,如果失败了再检测并替换非法字符。
        8
    manzhiyong   2017-12-23 14:47:04 +08:00
    一般我的目录名都是数字,是附件数据库 id 除以某个数(目录下存放文件数)的值。
        9
    frank611   2017-12-23 14:58:10 +08:00 via Android
    ???
        10
    Arnie97   2017-12-24 02:20:27 +08:00 via Android
    直接正则替换掉特殊字符不能满足需求?
        11
    abusizhishen   2017-12-24 14:16:40 +08:00 via Android
    @Arnie97 如果有模块能提供这个功能更好
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   1026 人在线   最高记录 4236   ·  
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.1 · 20ms · UTC 23:10 · PVG 07:10 · LAX 15:10 · JFK 18:10
    ♥ Do have faith in what you're doing.
    沪ICP备16043287号-1