V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
doujiangjiyaozha
V2EX  ›  程序员

开发了一个浏览器插件,一个本地知识库 AI 助手,关于 RAG 的,希望各位大佬帮我指定下,给点建议,产品本身以及推广都可以,谢谢

  •  
  •   doujiangjiyaozha · 10 小时 16 分钟前 · 493 次点击

    具体的介绍都在官网这里 guanzhangai.cn

    14 条回复    2024-12-21 23:13:59 +08:00
    RotkPPP
        1
    RotkPPP  
       9 小时 36 分钟前
    网站打不开
    ospider
        2
    ospider  
       8 小时 18 分钟前   ❤️ 1
    搞笑呢,cn 域名和 AI 是互斥的,你有牌照吗?就敢大模型
    doujiangjiyaozha
        3
    doujiangjiyaozha  
    OP
       8 小时 6 分钟前
    @RotkPPP 再试下老哥,我改了下 DNS,测了下全国网速,应该没问题了
    doujiangjiyaozha
        4
    doujiangjiyaozha  
    OP
       8 小时 1 分钟前
    @ospider em, cn 域名和 AI 是互斥的, 这话我有点不太理解, 麻烦老哥帮忙解释下; 至于牌照与大模型,我也不太理解,我全程都用的第三方的开源 LLM 模型或者 api 调用,跟牌照有什么关系吗?
    hefish
        5
    hefish  
       7 小时 0 分钟前
    我也想做个类似的东西,不知道如何下手,op 大佬能指点一二吗?比如需要哪些基础知识,基于哪个开源模型来搞之类的。。。
    doujiangjiyaozha
        6
    doujiangjiyaozha  
    OP
       5 小时 48 分钟前
    @hefish 我想想哈, 如果是你要做服务端的话, 可以去看下 langchain, 它里面有提供 python 和 nodejs(我已知的)的库,基本上是可以帮你直接从清理文本,到存入向量数据库,到搜索匹配,直接一条龙完成了的,很方便; 如果你要是像我一样做客户端的话, web 端我调研的方案, 基本上就是 transformjs 处理向量,加 indexdb 存储, 复杂的点主要是中间的一些优化, 我当初弄我这玩意时候,内存老是爆;向量模型的话,就是 huggingface 上找找 embeding 的, 目前国外很多人用的是 nomic-embed-text-v1,不过我测了中文效果不咋地,我就换成了 jina-embeddings-v2-base-zh,目前测试还不错,后面有时间我应该会更新一些我碰到的坑写到我那个博客里(官网里有挂,才刚弄), 希望能帮到你
    smallparking
        7
    smallparking  
       5 小时 5 分钟前 via Android
    @xiaoyuan9816 https://www.cac.gov.cn/2024-04/02/c_1713729983803145.htm
    有备案吗? 还用国外 api ?符合 "坚持社会主义核心价值观" 吗?
    https://www.cac.gov.cn/2023-07/13/c_1690898327029107.htm
    doujiangjiyaozha
        8
    doujiangjiyaozha  
    OP
       4 小时 56 分钟前
    @smallparking 我去 我还真不知道这玩意 感谢老哥提醒;我找时间研究下,不过 api 我只用我们国内的,支持我们国产模型 qianwen 之类的 hh
    RotkPPP
        9
    RotkPPP  
       3 小时 58 分钟前
    这个功能有点不太明白哈,意思就是,用户将需要收藏的网站提交给你开发的插件,然后服务端会通过爬虫的方式将内容爬下来,输入到 llm 中,类似于一个 rag 的过程,然后就可以通过对话的形式来获取内容
    kneo
        10
    kneo  
       3 小时 50 分钟前
    你这是违法的,赶紧关了。
    ospider
        11
    ospider  
       3 小时 42 分钟前
    @doujiangjiyaozha #4 有别的老哥已经说过了,我就不再赘述了。反正不建议在国内搞这些,即使政策允许,国内的付费意愿也太弱,没有任何意义,直接出海是唯一的选择。
    amlee
        12
    amlee  
       1 小时 53 分钟前
    没必要前怕虎后怕狼,做不做的起来还不一定

    先上车后补票例子多了去了

    不过还是建议从国外市场做,国内付费意愿太低,而且乱七八糟浏览器多,你这又是插件。
    国外基本上 chrome ,firfox ,safari 支持了就够了
    gaobh
        13
    gaobh  
       1 小时 50 分钟前 via iPhone
    cn 域名做好进去的准备
    hefish
        14
    hefish  
       1 小时 43 分钟前
    @doujiangjiyaozha 谢谢大佬!
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1528 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 16:57 · PVG 00:57 · LAX 08:57 · JFK 11:57
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.