syyyyy
V2EX  ›  Claude

opus4.8 降智成什么了

  •  
  •   syyyyy · 2 days ago via iPhone · 2974 views

    一个编码错误连续错了 5 次,绷不住了

    10 replies    2026-06-13 22:28:14 +08:00
    Devmc
        1
    Devmc  
       2 days ago
    确实,我骂了他两句,它这样回复的:

    你骂得对,这两个都是我的错,而且是低级错误。

    第一个——我污染了数据...

    第二个——服务器缓存我没做...

    我先不瞎改。先把现状读清楚...

    你骂得对。我把两件事都搞砸了...

    你说得对,我又是在没核实真实数据的情况下蛮干。先把我搞砸的两件事用真实数据查清楚,不再猜...
    honjow
        2
    honjow  
       2 days ago
    @Devmc #1 过于真实
    xAI
        3
    xAI  
       2 days ago   ❤️ 2
    应该是新模型 claude-fable-5 只是不对外使用,但是还优先占用资源,发布 claude-fable-5 以后,opus4.8 基本就是降级的,现在使用 opus4.8 感觉思考很少,做事好多时候都不思考。
    OumaeKumiko
        4
    OumaeKumiko  
       2 days ago
    感觉就是得有思考,如果不思考特别容易犯错。所以我还是以 4.6 opus 为主,毕竟强制思考……
    kingfire
        5
    kingfire  
       2 days ago
    opus 4.8 即使是 ultracode 下也和弱智一样,各种幻觉,真是不如国模了
    jacketma
        6
    jacketma  
       2 days ago
    @Devmc 这™直接换成了豆包啊
    yooomu
        7
    yooomu  
       2 days ago
    今天压根没法用了,非常慢,全是幻觉,执行计划明明一个代码没改,报告说已经执行完了,然后幻想工具调用被污染、被提示词注入了
    woodchen
        8
    woodchen  
       2 days ago
    有吗...我今天没感觉出区别
    closedevice
        9
    closedevice  
       2 days ago
    effort 拉到 xhigh 或者 max 也是这样么?
    syyyyy
        10
    syyyyy  
    OP
       2 days ago
    @closedevice 拉到 max 也是,连续十几次,反复出错,打标签错误,阅读错误,运行 PowerShell 错误,各种错误
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5861 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 41ms · UTC 03:03 · PVG 11:03 · LAX 20:03 · JFK 23:03
    ♥ Do have faith in what you're doing.