V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
siams
V2EX  ›  前端开发

分享下开源的浏览器爬虫插件 Univer Clipsheet, 简单易用

  •  
  •   siams · 1 天前 · 143 次点击

    Github: https://github.com/dream-num/univer-clipsheet

    安装地址: Release 页下载压缩包安装 Chomre 商店

    不想安装商店版本可直接在 release 页下载安装体验, 开源版本跟商店版本略有不同,开源版本数据都存在本地。

    主要功能

    支持自动识别当前页面中的表格,直接采集, 也支持配置多种分页、点击、滚动等重复动作,实现自动化采集。

    同时支持创建工作流定时执行采集功能,将采集的增量数据去重再更新等等。

    Core 代码

    这个采集插件的核心功能代码 core 放在了另一仓库,以包的形式被插件仓库引用,也同样开源,可以基于 core 提供的能力实现一个自己的采集插件,我也在 csdn 更新了第一章,大家有兴趣可以看看

    https://blog.csdn.net/2301_81013154/article/details/144995114?spm=1001.2014.3001.5502

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1004 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 20:40 · PVG 04:40 · LAX 12:40 · JFK 15:40
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.