V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
harsonyoung
V2EX  ›  问与答

请问有什么好的个人资料库存储思路吗?

  •  
  •   harsonyoung · 2022-05-13 20:14:32 +08:00 · 2704 次点击
    这是一个创建于 929 天前的主题,其中的信息可能已经有所发展或是发生改变。

    平时上网查资料时,发现一些写得特别好的个人博客文章会记录一下 URL ,但过一段时间想去回顾这篇文章,仅靠 URL 不太方便查找,有时好不容易找到这篇文章,但博客直接打不开了。 于是想着搭建个人资料库,整理出以下几个需求:

    1. 能方便的自由复制文章中的代码文字等。
    2. 样式特效等不要求保持原网页一致,只要求方便阅读即可。
    3. 能实现全文关键字搜索。
    4. 存储流程尽量做到自动化。

    我目前的方案是一个网页保存一份 mhtml 和一份 html 。搜索文章时在 html 中搜索关键字,找到后打开对应的 mhtml 。这种方案数据量较少时还比较方便,现在收藏网页数越来越多了,这样用起来实在不方便。找了一圈没发现有合适的轮子,想着手开发一套资料库,但一直想不到有什么好的方案。

    之前尝试过保存 html ,然后写脚本将 JS 、CSS 等外部引用内嵌。但效果不是很好,如果只针对某一种主题的网站,那没问题,但是不同网站前端得写不同的脚本,请教一下大家的个人资料库是如何存储的呢?

    21 条回复    2022-05-16 10:30:02 +08:00
    liuzhaowei55
        1
    liuzhaowei55  
       2022-05-13 20:23:34 +08:00
    onenote
    ltkun
        2
    ltkun  
       2022-05-13 20:25:15 +08:00 via Android   ❤️ 1
    很多吧 随便举几个例子 公有服务有各种笔记 私有的我用 joplin 和 wallabag 都是浏览器插件点一下就保存了
    mimzy
        3
    mimzy  
       2022-05-13 20:25:29 +08:00 via Android
    cubox
    renmu123
        4
    renmu123  
       2022-05-13 20:25:36 +08:00 via Android
    全文复制到笔记软件,想自动化找个剪藏插件
    monphey
        5
    monphey  
       2022-05-13 20:46:19 +08:00 via Android
    obsidian 配合 chrome 的 markdown 剪藏插件
    nuistzhou
        6
    nuistzhou  
       2022-05-13 21:31:27 +08:00 via iPhone
    onenote
    SenLief
        7
    SenLief  
       2022-05-13 21:35:12 +08:00
    简悦可以保存到 notion
    beyondex
        8
    beyondex  
       2022-05-13 21:41:30 +08:00
    我也剪藏了很多 但是 极少去看 后来养成一个习惯 就是真的很有用的 会写笔记记下来 其它 就再找一遍吧。
    可能 90% 的情况是这样。
    xQmQ
        9
    xQmQ  
       2022-05-13 23:08:38 +08:00 via iPhone
    obsidian + 浏览器简悦插件,提供导入页面到 obsidian 的功能
    sunlei
        10
    sunlei  
       2022-05-13 23:10:55 +08:00
    SingleFile + DEVONthink
    Pogbag
        11
    Pogbag  
       2022-05-14 00:19:51 +08:00 via iPhone
    cubox
    lishuolin
        12
    lishuolin  
       2022-05-14 00:42:43 +08:00 via iPhone
    DS NOTE 。前提是买一个 NAS
    ZC3746
        13
    ZC3746  
       2022-05-14 01:03:43 +08:00
    我的做法:
    1 、在浏览器上阅读,一股脑剪辑到印象笔记里
    2 、随时阅读,定期删除
    3 、汇总这些文章的思想、写成一篇文章,践行。这样才是真正吃透了这些文章。
    i3x
        14
    i3x  
       2022-05-14 09:13:07 +08:00 via Android
    保存 mht 或者 html 很多站点其实是无效的。
    我是页面截图+全文存数据库。。

    我写了个火狐插件。点击插件图标。弹出输入框询问输入补充说明,可以不填。
    然后插件就自动全屏截图。把所有的 css js html xhr 的文本拼接在一起。就不怕有文字搜不到了。是不是:真·全文搜索。
    服务端是 php+mysql 。图片编码后直接存入数据库。
    另外会自动保存页面上浏览器能直接“下载”的视频和 gif 。这两玩意儿是普通截图克星。

    对于功能类网页没办法。
    ZC3746
        15
    ZC3746  
       2022-05-14 13:13:55 +08:00
    @i3x 牛逼。
    haah
        16
    haah  
       2022-05-14 21:27:23 +08:00
    全屏截图
    shuxhan
        17
    shuxhan  
       2022-05-14 21:48:17 +08:00
    碰到有用的文章的话,我都是花上一到两分钟复制到自己的笔记本中,以后用到的时候直接用关键词搜索即可
    其实你这个问题可以引申为搜索功能和剪藏功能比较强大的笔记软件
    efcndi
        18
    efcndi  
       2022-05-15 00:16:12 +08:00
    @i3x #14 好奇,想了解下,你说的截图是真的截成了图片格式保存吗?这玩意怎么会方便搜索文字呢,ocr 的话效率是非常低的啊。
    i3x
        19
    i3x  
       2022-05-15 03:35:07 +08:00 via Android   ❤️ 1
    @efcndi 我说的还不清楚么?图片用于阅读。原始版本 html css js 所有的文本拼合成一个字段用于全文搜索。虽然效率很差,但是毕竟只有自己一个人在用,慢一点也无所谓。sqlite 或者 access 都能吃得消。单关键词搜索就是秒出结果,除非模糊之类的
    Danswerme
        20
    Danswerme  
       2022-05-15 09:37:28 +08:00
    我一般是直接生成 pdf 保存起来
    Vaspike
        21
    Vaspike  
       2022-05-16 10:30:02 +08:00
    Joplin 可以,网页加个官方的剪藏插件,直接保存在本地 Joplin 里了,实测剪成 Markdown 依然可读性很强(之前剪藏过廖雪峰网站讲 flex 布局的那篇,因为有时候写前端总要去翻一翻),比如:https://imgtu.com/i/OWMdBQ
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5407 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 08:03 · PVG 16:03 · LAX 00:03 · JFK 03:03
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.