V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
WinG
V2EX  ›  问与答

有没有方便微调各种大模型的工具

  •  
  •   WinG · 7 天前 · 715 次点击

    如题,有个数据集,想对比下在各个模型下微调后的表现。

    4 条回复    2024-12-27 11:28:43 +08:00
    handuo
        1
    handuo  
       7 天前 via Android   ❤️ 1
    有很多微调的库啊,llama-factory 和 swift 都可以,我在用,还有很多比如 unsloth, axolotl 等等
    WinG
        2
    WinG  
    OP
       7 天前
    @handuo 谢谢大佬 顺便问一下现在租什么云比较方便运行 llama-factory?微调 32B 的模型
    handuo
        3
    handuo  
       6 天前   ❤️ 1
    国内比较主流的有 UCloud( https://www.ucloud.cn/),商汤云大装置( https://www.sensecore.cn/product),我还在 B 站上看到一些 up 主推广过 https://gpuez.com/ ,看你预算了呗。我公司现在刚刚从 ucloud 迁移到 sensecore ,其实都差不多
    handuo
        4
    handuo  
       6 天前   ❤️ 1
    本质上没有什么放不方便,大部分就是用 docker 来跑现成的 llama-factory 的镜像,如果是多实例多机跑稍微注意一下环境变量配置就行,都一样的。可能有的厂商有自己配置好的镜像,但是也是以 deepseek 和 megatron 为主的,建议自己构建比较好
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5455 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 01:23 · PVG 09:23 · LAX 17:23 · JFK 20:23
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.