V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
maoqiucute
V2EX  ›  Local LLM

通过 dify 搭建了基于企业内部知识库的问答机器人,但是效果非常差

  •  
  •   maoqiucute · 52 天前 · 1430 次点击
    这是一个创建于 52 天前的主题,其中的信息可能已经有所发展或是发生改变。

    模型直接用的是 deepseek 官方 api 。

    嵌入式模型选择的是 bge-m3.

    知识库维护了企业内部的一些业务文档,但是使用 dify 的分段效果很差。

    请问各位优化的方向是什么?优质的知识库文档应该是什么样的格式?

    公司有一台价值 50 万的机器可供使用,如果用内部文档去自己训练效果会比外挂知识库好吗?

    14 条回复    2025-04-14 17:13:14 +08:00
    tool2dx
        1
    tool2dx  
       52 天前
    你这种需要微调模型的,dify 只能算是搜索引擎,提交时上下文限制挺大的,要让 AI 全部理解知识库,怕是很有点难度。

    你不如用官方 deepseek 的文档上传功能,我用下来没啥问题,基本都能理解。
    zhywang
        2
    zhywang  
       52 天前
    不建议微调模型,一般企业的知识库数据量太小,容易把模型微调残了
    优化方向应该还是从 RAG 知识库入手,试试其他的工具
    maoqiucute
        3
    maoqiucute  
    OP
       52 天前
    @zhywang 有其他工具推荐吗
    Goalonez
        4
    Goalonez  
       52 天前 via iPhone
    巧了,这两天接盘的活也是这个,甚至模型还是公司自己跑的 ds ,麻了。
    zj27
        5
    zj27  
       51 天前
    自己简单试过 anythingLLM ,可以回答出文档的内容,但是文档很小,模型是本地部署的最小的 1.5B 的 DeepSeeK ,仅供参考,公司内部也有这个 ai 知识库的需求,希望多多交流
    xsen
        6
    xsen  
       48 天前
    前阵子刚刚做过类似的,要调惨与测试,
    1. 父子分段
    2. 联合检索,要用 rerank 模型做检索
    maoqiucute
        7
    maoqiucute  
    OP
       48 天前
    @xsen 请教一下,知识库文档都是按照什么样的格式维护的,就普通 markdown 吗?还是说要转换为 Q&A 形式的
    xsen
        8
    xsen  
       48 天前
    @maoqiucute 我们直接上传的是 word 文档,关键是分段配置,还有检索模型要用 rerank——嵌入模型效果还是不太好
    wwcxjun
        9
    wwcxjun  
       47 天前 via Android
    试试 ragflow ?知识库效果应该比 dify 好。
    maoqiucute
        10
    maoqiucute  
    OP
       45 天前
    @wwcxjun 目前尝试用了 dify 的父子分段,手动指定分段标识符 有一些效果
    maoqiucute
        11
    maoqiucute  
    OP
       45 天前
    @Goalonez 怎么样兄弟,有什么经验分享吗?
    maoqiucute
        12
    maoqiucute  
    OP
       45 天前
    @zj27 有什么经验分享吗?
    aaronlam
        13
    aaronlam  
       15 天前
    楼主有相关的经验分享吗?最近刚好也在做这方面的工作。
    XyIsMy
        14
    XyIsMy  
       10 天前
    @aaronlam +1 ,我也是,头太
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5372 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 45ms · UTC 02:48 · PVG 10:48 · LAX 19:48 · JFK 22:48
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.