V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
wsbqdyhm
V2EX  ›  程序员

2025 年了,有没有这样的一个 ai 工具?

  •  
  •   wsbqdyhm · 10 天前 · 3184 次点击

    就是我有一些 word 文档、excel 文档、ppt 文档、图片、txt 文档,总之是大杂烩,放在一个文件夹,然后有没有 ai 工具能够根据这个文件夹去整合内容,例如提示词:我要在这个文件夹检索资料,然后输出一份年终总结 ppt 或者 pdf 。(图文并茂的那种)

    20 条回复    2025-01-15 22:13:26 +08:00
    v2exgo
        1
    v2exgo  
       10 天前
    ragflow 试一下,可以搞私人知识库,
    v2exgo
        2
    v2exgo  
       10 天前
    目前貌似 没有什么好的工具 能直接切分好 乱七八糟的文档,这些工具里面自带了一些文档切分工具,你可以看下,私人知识库,目前的难点就是将文档切分成元数据,后面都是接的各种大模型的接口
    leewlab
        3
    leewlab  
       10 天前
    notebooklm
    mumbler
        4
    mumbler  
       10 天前
    gemini 就可以,支持 200 万上下文,可以把各种文件上传,然后提问就行了
    yuwangG
        5
    yuwangG  
       10 天前
    你需要的是 RAG
    RRRoger
        6
    RRRoger  
       10 天前
    @yuwangG RAG 擅长的是检索回答 并不适合去总结 这个目前只能长上下文去做
    huihushijie1996
        7
    huihushijie1996  
       10 天前
    同问
    huihushijie1996
        8
    huihushijie1996  
       10 天前
    @huihushijie1996 感觉没有一个好用的 ai 本地知识库,好多不是部署麻烦,就是并不像本地 ai 知识库 打着本地知识库的名义实际是联网的
    635614874
        9
    635614874  
       10 天前
    腾讯 ima
    wqhui
        10
    wqhui  
       10 天前
    上传到知识库,然后总结
    RandomJoke
        11
    RandomJoke  
       10 天前
    楼上那些说 rag 的,RAG 是检索增强的,根本不适合做总结的啊。。。
    wsbqdyhm
        12
    wsbqdyhm  
    OP
       10 天前
    @v2exgo @leewlab @mumbler @yuwangG @635614874 好,谢谢以上各位,上面提到的 ragflow 、notebooklm 、gemini 、RAG 、腾讯 ima 都会用一轮,看哪个最为接近我的需求,随后回来反馈一下。
    zomfg
        13
    zomfg  
       10 天前
    @wsbqdyhm 等你来回来分享
    JayZXu
        14
    JayZXu  
       10 天前
    这需求其实现在来说不好实现
    RAG 知识库主要是为了大海捞针,但是总结是需要全文输入
    本质上,数据量大了,都要掌握,微调才是最好方法,但是又有点小题大做了
    blur1119
        15
    blur1119  
       10 天前
    kimi 不知道行不行 你试试
    clemente
        16
    clemente  
       10 天前
    我可以做.
    stong2
        17
    stong2  
       10 天前
    https://github.com/eosphoros-ai/DB-GPT
    有个 DB-GPT 的项目可以看看
    0x5c0f
        18
    0x5c0f  
       10 天前
    你这个其实需要的是像 fastgpt 这种的 , 但很多情况下,这些都得自己弄
    sampeng
        19
    sampeng  
       9 天前
    总结类的很难做到。
    我觉得有几个原因
    1.注意力问题,很好测试,弄一本书,随机插入固定字符串,让他总结在哪些地方,肯定会丢。不管有多大上下文。如果解决了这个问题,AI 的实用性是一大提升
    2.另一部分就是资源的格式问题,现在没有任何产品能做到完美的自动识别所有的资源。因为格式千奇百怪的,说的就是你 pdf 。OCR 技术可以帮忙,但是布局推测会有的好有的不好。
    3.就是成本问题,现在的成本如果做 rag 。资源特别多的成本是很高的,而且还要做到跨资源总结,目测是没有产品做到,就算做到,效果也很差。
    hez2010
        20
    hez2010  
       9 天前
    你说的超级增强版就是 Microsoft 365 Copilot (商业用户的那个,不是个人用户的)。
    买个 Microsoft 365 商业版订阅然后开个商业版的 Copilot ,他就会把你 OneDrive 里所有的数据都综合到一起让 AI 帮你组织起来。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2426 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 08:55 · PVG 16:55 · LAX 00:55 · JFK 03:55
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.