V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
xieqiqiang00
V2EX  ›  程序员

OpenAI 新模型将对 AI 套壳应用来一波革命

  •  
  •   xieqiqiang00 · 32 天前 via Android · 1171 次点击
    这是一个创建于 32 天前的主题,其中的信息可能已经有所发展或是发生改变。

    groq 上 oss20b 近 6000token 每秒的输出速度

    已经是量变引起质变了

    快了将近 100 倍

    iwdmb
        1
    iwdmb  
       32 天前
    iwdmb
        2
    iwdmb  
       32 天前
    https://gpt-oss.com/
    官方测试渠道
    YsHaNg
        3
    YsHaNg  
       32 天前
    可能要 hopper 以上更新架构的加速器 垃圾佬平台不如 qwen3:30b 上下文预分配内存以及 offload 效率很低
    sam2478
        4
    sam2478  
       32 天前
    @iwdmb 是网站出问题了吗?我打开没并没有对话框
    jianyang
        5
    jianyang  
       32 天前
    gpt-oss 120b 推理加结果,token 吐字快到离谱
    xieqiqiang00
        6
    xieqiqiang00  
    OP
       26 天前 via Android
    groq 我还看到有超过一万 token 每秒的
    xieqiqiang00
        7
    xieqiqiang00  
    OP
       26 天前 via Android
    120b 的版本在英伟达官方的数据里甚至能跑到 2 万 token 每秒每卡
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5354 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 05:48 · PVG 13:48 · LAX 22:48 · JFK 01:48
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.