V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Junyiz
V2EX  ›  Node.js

抓取新浪博客的命令行程序: dature

  •  
  •   Junyiz · 2018-03-21 10:21:58 +08:00 · 4503 次点击
    这是一个创建于 2442 天前的主题,其中的信息可能已经有所发展或是发生改变。

    dature 是基于 Node.js 的爬虫程序,可以抓取新浪博客某博主的全部博文,包含标题、正文、时间、分类、图片,并生成 HTML 文件。

    安装

    npm install -g dature

    使用

    dature sina_blog_uid

    详见: https://www.npmjs.com/package/dature

    6 条回复    2018-03-28 13:06:17 +08:00
    JohnChiu
        1
    JohnChiu  
       2018-03-21 11:08:45 +08:00 via iPhone   ❤️ 1
    赞!顶一下支持~
    Junyiz
        2
    Junyiz  
    OP
       2018-03-22 15:25:40 +08:00
    今天更新了生成 HTML 的模版
    xuyl
        3
    xuyl  
       2018-03-27 15:19:17 +08:00
    试用了下,生产的模板有问题,Cannot read property 'title' of undefined,
    xuyl
        4
    xuyl  
       2018-03-27 15:25:29 +08:00
    新浪博客?还以为是微博。。。
    Junyiz
        5
    Junyiz  
    OP
       2018-03-27 17:40:16 +08:00
    @xuyl 对的
    Junyiz
        6
    Junyiz  
    OP
       2018-03-28 13:06:17 +08:00
    已支持抓取 CSDN 博客
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1046 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 21:31 · PVG 05:31 · LAX 13:31 · JFK 16:31
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.