V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
lizon
V2EX  ›  机器学习

问个机器学习的问题,用训练好的小模型串联使用可行吗

  •  
  •   lizon · 2023-02-18 16:47:32 +08:00 · 1691 次点击
    这是一个创建于 645 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我不是做机器学习的,缺乏相关领域常识

    最近看 chatGPT 都是说训练大模型,感觉是想一个模型干很多事

    我想以后网上会不会有很多训练好的小模型,都只解决好一个小问题,然后把他们的数据输出对接起来,再当成整体进行训练,得到一个可以处理复杂任务的组合模型

    大家可以自行选择训练好的小模型组合成复杂模型,也可以自己从头训练效果更好的小模型

    我个人不希望强 AI 被某几个巨头公司垄断,不知道以后 训练自家的小模型 和 串联小模型训练复杂模型 有没有搞头,普通开发者有没有机会参与一下

    6 条回复    2023-07-25 12:24:04 +08:00
    NoOneNoBody
        1
    NoOneNoBody  
       2023-02-18 17:58:49 +08:00
    这个问题……
    一般模型就是针对具体应用的,至少目前是这样

    例如一张人像风景照片,问这是谁什么时候在哪拍的?
    实际上从问题就已经分隔出三个子问题处理了:谁、年龄、地点,对应人脸识别、年龄识别、风景点识别三个模型

    有些很难分割的问题,它直接对应的就是一个模型
    例如 A 、B 、C 哪个好?要么按一些特定标准分割打分,要么将所有人的回答一起训练学习。前者是标准很清晰的时候,按机器学习方式进行,后者是标准很模糊甚至权重不同影响答案较大的,按深度学习进行

    然后,你的问题还有另一个层面,不知道你是否指这个?
    就是数据采集,巨头可以采集一亿人的身份证做一个模型,但能不能十万个小单位各自采集一千人的身份证做模型,这十万个小模型合起来用?
    答案是很难,还是要元数据合起来做模型,而不是一堆模型合起来
    模型已经是半成品,不能还原原始数据
    Muniesa
        2
    Muniesa  
       2023-02-18 18:32:29 +08:00 via Android
    串联小模型应用很多了,比如 OCR 是拆成文本检测、方向分类和文字识别,至于你说的当成整体训练,如果模型内部是分开的,和单个模型分开训练没有区别,如果要共用结构,那其实就是大模型。
    Windn0
        3
    Windn0  
       2023-02-18 20:14:51 +08:00 via iPhone
    只能说你突发奇想,想太简单了。
    nightwitch
        4
    nightwitch  
       2023-02-18 23:37:34 +08:00 via Android
    "再当成整体进行训练,得到一个可以处理复杂任务的组合模型"

    本质上不就是拼成了一个大模型?
    分阶段做处理也不是什么新思路了,你翻翻 2011 年附近的论文那个时候显卡还很弱鸡,也没好用的 dl 框架,拿到一个复杂任务都要分好几个阶段用不同的模型去处理
    sujin190
        5
    sujin190  
       2023-02-19 10:09:55 +08:00 via Android   ❤️ 1
    只是量变累加并不能得到质变
    sky497134710
        6
    sky497134710  
       2023-07-25 12:24:04 +08:00   ❤️ 1
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5176 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 37ms · UTC 03:56 · PVG 11:56 · LAX 19:56 · JFK 22:56
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.