V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
tlerbao
V2EX  ›  程序员

抛开性价比这个选项,你认为目前写代码最强模型是?

  •  
  •   tlerbao · 22 天前 · 7961 次点击

    答案无疑肯定是在 Codex 和 Claude Sonnet/Opus 中产生。

    为什么要抛开性价比这个选项?

    我发现现在甚至有人还在吹 Deepseek 、GLM 。

    2025 年了,哪吒票房那段时间还没完?年还没过完?

    吹的有两种人(我说的比较难听):

    1. 用不起贵的,强行拉出性价比,所谓的便宜好用。
    2. 爱国,大谈 Claude 敌对势力。

    所以,你认为

    抛开爱国情绪、抛开花费,目前写代码最强模型到底是 Codex 还是 Claude ?

    没深度使用过多家的,没对比过的,只用过某一种的,回答也基本没有什么参考价值。

    79 条回复    2025-10-09 10:10:03 +08:00
    mooyo
        1
    mooyo  
       22 天前 via iPhone   ❤️ 3
    claude-sonnet-4.5
    imjiaoyuan
        2
    imjiaoyuan  
       22 天前 via Android
    claude-sonnet-4.5


    和这个比起来国产的像低能儿
    TimePPT
        3
    TimePPT  
    PRO
       22 天前 via Android   ❤️ 1
    GPT-5 High
    ty29022
        4
    ty29022  
       22 天前 via iPhone   ❤️ 3
    我个人的感觉是 gpt5 像个 cs 科班的大佬
    claude 像个经验丰富的中级程序员 对复杂情况无能为力
    novaren
        5
    novaren  
       22 天前 via Android
    claude 毋容置疑
    facebook47
        6
    facebook47  
       22 天前 via Android   ❤️ 6
    Claude 写代码无敌,另外在这个论坛,头一次听说有人吹 deepseek 的,一拉一踩非常不可取
    spike0100
        7
    spike0100  
       22 天前 via iPhone
    我自己用下来 glm 其实还好。主要差别是 claude sonnect 4.5 一般一次生成的代码直接就可以跑,glm 需要主动提醒一两次才能调好。最终效果感觉差别不大。
    spike0100
        8
    spike0100  
       22 天前 via iPhone
    @spike0100 都是用 claude code + 对应基础模型测的。deepseek 和 qwen3 max 试过跑了 50 ,60 人民币的 token ,结果都没法看。
    takanashisakura
        9
    takanashisakura  
       22 天前   ❤️ 1
    说性能的话毋庸置疑吧。但是在真正用的时候,很难不考虑性价比和可用性吧。
    所以我也没得选,只有 deepseek 和 gemini 。
    xiaojie668329
        10
    xiaojie668329  
       22 天前
    有时候 Gemini 做得比 Claude 好
    raydg7777
        11
    raydg7777  
       22 天前
    还是 Codex
    Alias4ck
        12
    Alias4ck  
       22 天前   ❤️ 1
    吹 glm 的和 deepseek 的 肯定是没吃过细糠
    victor
        13
    victor  
       22 天前   ❤️ 1
    claude 够快所以是主力。但 claude 4.5 写完的功能,codex 还能挑出来一堆毛病。
    skiy
        14
    skiy  
       22 天前   ❤️ 8
    你抛开花费但抛开不了人家不让你用吧?这是不可控因素。刚刚又有 up 说自己被封号了。
    yb2313
        15
    yb2313  
       22 天前
    抛开花费我选同时使用几个顶尖模型,然后每次需求选择最好的一个结果,即使不同时使用也可不断轮换使用对比每个模型擅长领域。
    lithiumii
        16
    lithiumii  
       22 天前 via Android
    可能有一个月没写代码了,之前是用免费的 copilot 里的旧版本 gpt (好像是 4.1 )和 Claude ( 3.5 吧大概)或者用 Aider 调免费的 Gemini 2.5 Pro ,或者付费的 DeepSeek V3 或者 3.1 和 GLM 4.5 (这俩便宜)。
    体感最强是 Gemini 2.5 Pro ,其次相差不远是 DS 和 GLM ,免费 copilot 送的模型是真的不行了。
    haiku
        17
    haiku  
       22 天前 via Android   ❤️ 1
    GPT 5 high
    下个月等 Gemini 3
    streamrx
        18
    streamrx  
       22 天前 via iPhone
    gpt5 high
    zpvip
        19
    zpvip  
       22 天前
    claude-sonnet-4.5
    这个是毒品, 不能碰
    Imindzzz
        20
    Imindzzz  
       22 天前 via Android   ❤️ 15
    你想抛开谈就抛开谈呗,为啥要贬低一下“吹”deepseek...
    mywjyw
        21
    mywjyw  
       22 天前
    codex cli 做的比 claude code 差,很多功能不全,很难用
    lancevps
        22
    lancevps  
       22 天前
    生成 html 的 UI 设计稿,豆包最强
    sunnysab
        23
    sunnysab  
       22 天前   ❤️ 1
    额,倒也不是爱国情绪,https://www.reddit.com/r/LocalLLaMA/

    reddit 上很多外国人考虑中国的模型,超级积极… qwen 和 glm 评价不错。llama 挨骂较多,openai 被骂的也不少
    Thymolblue
        24
    Thymolblue  
       22 天前
    现在用 GPT-5 和 Claude 有什么渠道吗?直接用 API 都需要组织认证,目前国内身份没法通过
    yyws2012
        25
    yyws2012  
       22 天前 via Android
    @mooyo 都不考虑价格了还 sonnet
    yyws2012
        26
    yyws2012  
       22 天前 via Android
    @skiy 可以买别人转接的,就是 opus 会非常贵,但既然不考虑价格那就是可以的
    ggp1ot2
        27
    ggp1ot2  
       22 天前
    Claude Sonnet 4.5

    没有什么价格不价格的,这个模型可以满足我现在的需求
    mooyo
        28
    mooyo  
       22 天前
    @yyws2012 #25 sonnet 4.5 现在就是比 opus 4.1 好用啊。有又快又好用的为啥要用又慢又垃圾的
    charles0
        29
    charles0  
       22 天前
    GPT-5 high (比 GPT-5-Codex 强很多)
    Bad0Guy
        30
    Bad0Guy  
       22 天前
    cc ,但是封号比 codex 还疯狂,如果 Gemini3 效果比 Claude4.5 好那我会考虑日常转用 Gemini3
    Gekou
        31
    Gekou  
       22 天前
    没用过 claude ,但 claude 肯定不能一次处理 100w 的 token ,10w 行代码
    反驳请给出详细方法谢谢
    plasticman64
        32
    plasticman64  
       22 天前
    claude 会找 bug ,这是我最佩服的一点
    v20220522
        33
    v20220522  
       22 天前
    @charles0 为什么会这样, 能展开讲讲吗?
    lcandy
        34
    lcandy  
       22 天前
    @TimePPT 支持,codex-high 都没 5-high 好用
    agagega
        35
    agagega  
       22 天前 via iPhone   ❤️ 8
    为了那点所谓的优势整天琢磨哪个模型在 benchmark 里表现更好真的有意思么,还不如找到一个坚持用下去。有 gemini 用 gemini ,没有用 deepseek-v3 也能达到目的。天天炒作 claude 看着都麻了,是不是公司的政治观点还会影响用户?
    jonty
        36
    jonty  
       22 天前
    2025 年了,还有人在对比最强模型?谁不知道 claude 好用,是大家不想用吗?
    rubyacgn
        37
    rubyacgn  
       22 天前
    谁没事国庆写代码啊
    binaryify
        38
    binaryify  
       22 天前
    Codex 虽然有点慢但是经常一步到位, claude 像是应届生,着急写代码,但是经常返工
    bytesfold
        39
    bytesfold  
       22 天前 via iPhone
    Claude 4.5 体感跟 Codex 效果区别不大了;
    Claude 4 体感就是愣头青
    asuka02
        40
    asuka02  
       22 天前 via Android
    你这是从抖音学的标题吗?
    zy5a59
        41
    zy5a59  
    PRO
       22 天前
    我感觉这两个是互补的,codex 写逻辑强一些,但是 UI 写出来是真丑,claude 正好相反
    xuhuanzy
        42
    xuhuanzy  
       22 天前 via Android
    codex 上下文读取很激进,对于复杂项目效果远超 claude
    Bluecoda
        43
    Bluecoda  
       22 天前
    claude-sonnet-4.5 用下来比 gpt5-high 强多了,速度又快,体验感太棒
    kennylam777
        44
    kennylam777  
       22 天前
    @sunnysab Local AI 來講中國的開放 LLM 的確不錯, 但私有商業 SOTA(只賣 API 那種)模型比還是比中國模型強
    welcomezhangjun
        45
    welcomezhangjun  
       22 天前
    claude-sonnet-4.5
    coderlxm
        46
    coderlxm  
       22 天前 via Android
    codex-gpt5-high
    bf109_
        47
    bf109_  
    PRO
       22 天前
    codex cloud 吊打一切
    yjxjn
        48
    yjxjn  
       22 天前
    claude-sonnet-4.5
    CodeX
    Aolose
        49
    Aolose  
       22 天前   ❤️ 1
    抛开性价比?那我选择牛马大模型
    gfbts
        50
    gfbts  
       22 天前
    @Aolose 牛马竟是我自己
    mendax2019
        51
    mendax2019  
       21 天前
    gemini 2.5 pro ,快也是强
    pkokp8
        52
    pkokp8  
       21 天前
    顺便想问问大家,各位用这些模型的时候都是开箱即用吗
    会不会有什么奇技淫巧是我不知道的
    BernieDu
        53
    BernieDu  
       21 天前
    @xuhuanzy codex 读的上下文可能更多,你让他给代码找错确实更好用,但是一旦让它上手干活比 4.5 差远了,还是搭配着用吧
    ferock
        54
    ferock  
    PRO
       21 天前 via Android
    cl 4.0 ,没钱用 4.5 还没体验过
    andrew2558
        55
    andrew2558  
       21 天前
    现在这些大模型写代码是真的强呀,期待 gemini3
    gmuubyssss
        56
    gmuubyssss  
       21 天前
    @sunnysab 跟人家天天骂川普一样,你能天天????????
    jiayouzl
        57
    jiayouzl  
       21 天前
    毫无疑问 claude-sonnet-4.5
    salor
        58
    salor  
       21 天前
    写代码 GPT-5 High ,修 bug GPT-5 Pro
    Seck
        59
    Seck  
       21 天前 via Android
    没有先发优势?
    强者恒强,互联网的赢者通吃效应?🌚

    超过,想过了,直到 ai 热潮结束,也不能超过!

    要真是超过才是危险的,妈的做了三个版本才火起来,今天对面随随便便,资源比你少,人才投入比你少,市场价格比你低,然后被超越

    那估计三战就来了,创新失败效应才是人类社会进步最后的壁垒,如果创新者被对面:资源,人才,技术,市场,教育都不如你超过……那世界才真有意思
    234ygg
        60
    234ygg  
       21 天前
    但凡有点水平的代码,gpt 明显强一大截,垃圾代码的话 claude 和 gpt 差不多
    wangweiggsn
        61
    wangweiggsn  
       21 天前
    @mendax2019 我也用的 Gemini Pro 2.5, 注册 API 免费,vscode 里配置一下 API key 直接用,我用量没超,一直是免费的。
    qoras
        62
    qoras  
       21 天前
    gpt5-high 比 gpt5-codex 好,就是有点慢,不过可以加钱用 gpt5-high-fast
    kulove
        63
    kulove  
       21 天前 via Android
    抛不开 用了几天 Codex 效果差很多
    novaa
        64
    novaa  
       21 天前
    windows 下用了下 codex 跟个智障一样各种错误
    lscho
        65
    lscho  
       21 天前 via Android
    你想问就问,非要贬低一下别人。。。

    其实所有模型都试用一两个月你就会发现,所有的模型都有它擅长和不擅长的。

    而且每个人的使用习惯不一样(提示词习惯、规则配置、项目配置等),甚至网络环境的区别都会导致他对不同的模型体验不一样。

    所以这玩意目前我觉得没有固定答案,每个人都可以多试用几种来找到最合适自己的。

    就个人而言,claude 在大多数情况下符合预期,但是在少部分情况下确实有可能表现的还没有其他模型好。所以我已经习惯多种模型交叉验证解决稍微复杂的问题。
    shintendo
        66
    shintendo  
       21 天前
    lovdanny
        67
    lovdanny  
       21 天前 via Android
    我最近真切感受到 Codex 的强大——比我之前在 Cursor 里用的 Claude 模型更稳,也更少生成冗余代码。最近我用 Codex 一口气写完了一个 Rust 命令行工具(用于处理 TSV 和 Excel 表格数据,tsvkit: https://github.com/dawnmy/tsvkit ),基本上都是一次就过。

    前期用的是 Local 模式,额度用完后换成 Cloud 模式,结果真是让我震惊,在这种通用编程任务上,AI 已经可以做到几乎“代写”了,人只需要提清楚需求就行。
    kneo
        68
    kneo  
       20 天前 via Android
    不知道是不是错觉,前段时间 claude 降智,到现在我觉得 sonet 4.5 也智障一样,没缓过来。都在推 sonet 4.5 我还挺意外的。
    Wkj1998
        69
    Wkj1998  
       20 天前 via Android
    @Gekou 这么多代码,逻辑复杂应该只有 GPT-5-high 、Gemini2.5 Pro 能处理了,
    Wkj1998
        70
    Wkj1998  
       20 天前 via Android
    GPT-5-high 、Claude Sonnet4.5 、不截断的 Gemini2.5 Pro ,最重要的是互补,每个 LLM 都有短板,要取长补短
    anteros
        71
    anteros  
       20 天前
    哪个被骂的人最多,就用哪个。我说的是世界范围内。
    yippee0539
        72
    yippee0539  
       20 天前
    之前也是一直用 claude
    但是架不住贵/白嫖的不稳定
    索性 dp 了,够用、快、稳定、便宜
    byasm32
        73
    byasm32  
       20 天前
    Gemini 2.5 Pro 已经完全够用。。超长上下文支持,几百 k 的附件代码也随便分析,速度也快。
    yyws2012
        74
    yyws2012  
       20 天前 via Android
    @byasm32 gemini 非常擅长讲述内容,但是在分析较多内容时幻觉严重,之前我让它分析代码它能信誓旦旦地说出一个不存在的 feature
    ptstone
        75
    ptstone  
       19 天前
    ”我发现现在甚至有人还在吹 Deepseek 、GLM “ 。 八月底九月初的时候,我用 deepseek 和 sonet 4 ,同样的提示词写一个项目,deepseek 做的 ui 效果明显强与 sonet4.1 。 都是用 claude code 。后来放弃了 sonet4 生产的项目,用 sonet 4 接着 deepseek 生成的项目接着写后端,做单一任务,deepseek 在某些方面不一定差,做复杂任务,需要关联很多代码,你不提示 deepseek 会不读仓库其他代码直接写,sonnet 不降智的情况下,会读应用到的代码。凡是不要这么武断下结论。
    fourninenine
        76
    fourninenine  
       19 天前
    我就是第一种人😁我来反驳第二种
    什么叫“大谈敌对势力”?
    deepseek 不让美国人用了吗?
    到底是谁在搞敌对?
    Vaspike
        77
    Vaspike  
       18 天前 via iPhone
    写 UI 我个人觉得 Gemini 依然最强
    NineTree
        78
    NineTree  
       16 天前
    claude code
    millken
        79
    millken  
       16 天前
    Claude Sonnet 4.5 确实用起来最爽
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2622 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 12:58 · PVG 20:58 · LAX 05:58 · JFK 08:58
    ♥ Do have faith in what you're doing.