V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
drymonfidelia
V2EX  ›  程序员

充了 Google One, Gemini 的智商依旧是所有 AI 垫底

  •  2
     
  •   drymonfidelia · 37 天前 · 5749 次点击
    这是一个创建于 37 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我 4 个月前就喷过一次 Gemini 最会胡说八道,最近很多人说 Gemini 大幅升级了,还弄了很强的代码 Canvas 功能,我特地充了一个月 Google One ,来测试到底什么水平

    场景 1 我需要一个合并 Blender 材质球的脚本,Grok 3 现在降智非常严重,写了一个 Bug ,调用 .clear() 会导致所有 index 被重置为 0 ,导致去 map 里匹配的时候匹配出来的全部都是第一个材质球,导入 Unity 后第二个 Material 会消失。我开始也不知道是 slot 的问题,按照 Grok 胡说八道的方法调了好久函数顺序。我想试试把代码贴到别的 AI 能不能排查出这个 bug

    相同问题,Claude 未充值


    Gemini 已充值



    光看脚本两个都 AI 都完全没想出问题,重试了三四轮都在瞎改




    我想给它们提示下,但是我测试贴截图会切换到智商更低的读图模型,只会 OCR 然后告诉我图里的字完全没有思考,然后我想到了把两个 fbx 都转成 ASCII FBX ,只贴导致问题部分的 diff




    Claude 虽然还是没搞定,但它帮我插入了一堆日志点,让我运行它给的调试脚本
    Gemini 则继续瞎改,改了五六遍就是不动有问题的 .clear() 那行



    最后 Claude 解决了问题



    该场景意外表现最好的竟然是 ChatGPT ,免费版 4o 第一轮就找到了问题,虽然给出的修复脚本有点瑕疵没有按照原脚本的变量名,不过改一下就好了



    场景二 写正则
    我需要一个脚本来过滤一个 60 万行 C# 代码中不需要的 class 和一部分 class 中的 fields ,这个场景用 AST 更合适,但是 AI 写不出来,我就让它用正则弄。这事情简单到连最便宜的 deepseek 都能搞定

    Gemini 第一轮给我的 Python 脚本好几处错误根本运行不了


    修复后匹配一个 enum 直接给我匹配了整个文件


    我想测试他宣传的长上下文功能,直接把这个文件贴给他,结果这下智商彻底归零了,怎么提示它给我的都是一行也输出不出来的脚本,只能重开一个会话




    按点给它提示,就是搞不定

    还尝试了非常多遍,截图就不贴了,已经太长了


    最后实在没耐心了

    同样是很会胡说八道( /t/1101072 )的 Claude 改了 4 个版本 解决
    43 条回复    2025-06-13 12:12:12 +08:00
    qhx1018
        1
    qhx1018  
       37 天前
    那么哪个更好?(免费的)
    disorientatefree
        2
    disorientatefree  
       37 天前   ❤️ 4
    但其实一个例子并不说明问题呀, 我开了各家会员很多麻烦的问题都是 Gemini 2.5 Pro / Opus 4 / Grok 3 挨着问一遍, 很难说哪家好哪家差

    我现在的倾向是

    搜索/识图/视频/音频 -> Gemini
    辅助读大段 code -> Gemini 2.5 Pro
    大段代码生成(比如做个 demo) -> Grok 3
    小段复杂代码 -> 先 Opus 4, 不行的话每个 AI 挨个反复聊
    Deep Research -> Gemini
    Debug -> Opus 4 / Sonnet 4, 有时候 Opus 不一定比 Sonnet 好
    msg7086
        3
    msg7086  
       37 天前
    Google One 没用过,不过我用 Gemini 2.5 Flash 写代码感觉水平还是挺好的,都没用到 Pro ,感觉日常用用足够了。话说你为什么要贴截图?直接把源码加进 Context 或者让他 read file 不就好了?还有为啥要用网页版?看着你的帖子我感到非常迷惑。
    zhaoahui
        4
    zhaoahui  
       37 天前
    基米是这样的
    kneo
        5
    kneo  
       37 天前
    复杂的问题要看运气。如果指令清晰,Gemini 写的代码我感觉还是更靠谱一点。
    gpt5
        6
    gpt5  
       37 天前
    gemini 的上下文长度碾压其它。
    在长上下文场景中,没其他选择啊。
    deepbytes
        7
    deepbytes  
       37 天前 via iPhone
    前一段时间里,美国 ip 就可以免费升级 google pro 一年半…已白嫖好久,现在用来做 gpt 的日常平替
    wa007
        8
    wa007  
       37 天前 via iPhone
    提供个样例,Gemini 整体的准确性比 claude 和 chatgpt 更好。
    zczy999
        9
    zczy999  
       37 天前
    google one 不用冲啊!!!
    都是白嫖的 之前有 bug 一个链接直接升级
    或者搞个教育邮箱 他这个检测就跟白送一样很宽松的
    不像 cursor gpt 这种还需要 sheerid 验证
    meteora0tkvo
        10
    meteora0tkvo  
       37 天前
    国外 ai claude 才是真神
    extrem
        11
    extrem  
       37 天前
    我体感和你相反,使用场景是代码讲解+做题,gemini 的思路和语言表达的可读性上明显高于 o3,o4-mini

    严重怀疑我的号最近被降智了,有时感觉 2 个推理模型的回答还不如 4o
    yb2313
        12
    yb2313  
       37 天前
    之前一直吹 gemine 很强, 但我怎么用都感觉很笨 , 可能是中文不适配, 但 grok3 就很强, 比通义的厉害
    cherryas
        13
    cherryas  
       37 天前
    你只是赶上 gemini2.5pro 降智了,

    昨天我也写一个汉字转无注音拼音

    改了 10 来次还是低级报错

    注意是低级报错而不是有 bug

    要知道以前写过难好几倍的功能

    有直接成功的,也有逻辑有 bug 的

    但是没有基础问题一直报错的

    最后用 claude 重写了一下好了
    Eddiegaao
        14
    Eddiegaao  
       37 天前
    gpt 和 gemini 都有 20 刀档位订阅,同感,gemini 弱智,但是在一些极少数的情况下,比 gpt 好用,而且太好用了。但是绝大多数情况都是 gpt 更靠谱!
    wu67
        15
    wu67  
       37 天前
    gemini 的问题在于它喜欢瞎编...给的代码有时候是跑不起来的, 他就硬编了一个 API 名字给我‘实现’...
    conky
        16
    conky  
       37 天前
    google one 不是免费一年多吗?你为啥还去充值
    Ocean810975
        17
    Ocean810975  
       37 天前
    Gemini 数学能力是真的强,最近在推导强化学习的公式,发现就 Gemini 能做到精细的推导,而且很像是人写出来的推导,兼顾计算与思维方式,但 ChatGPT o3 就差点,还有的时候推着推着给你讲其他公式去了……
    我是先用的 o3 后改的 Gemini 。
    ztaosony
        18
    ztaosony  
       37 天前
    我的体验是 gpt 大部分时间比 gemini 靠谱,但 Gemini 也不至于比 grok 差
    iyiluo
        19
    iyiluo  
       37 天前
    gemini 访问方便,速度快,我还挺喜欢用的
    tyqing
        20
    tyqing  
       37 天前
    最近写了几个 shell 脚本,还是 Claude 好用
    pulutom40
        21
    pulutom40  
       37 天前 via iPhone
    用了很久,还是 chatgpt 好用,好用不是指回答,而且“请帮我把这个图片转成 png 格式”,除了 chatgpt 以外都是让你用 xxx 工具自己操作,而 chatgpt 直接把转好的文件给你了
    youthfire
        22
    youthfire  
       37 天前
    1. AI Studio 里的 gemini 和 gemini 客户端/网页端不是一个东西。前者质量明显高,并且有说法温度调整到 0.7 更好。后者相比前者,对于上下文以及输出都有更多的限制,思考时间更短,官方说法是需要更快输出。

    2. gemini 质量最高的肯定是 3 月版本,只是现在换了用不到了,不表示曾经没有特别优质。ceo 自己在 x 上都承认了相比 3 月的降智,6 月已经比 5 月版本改进一些了。

    3. 我自己体会是 gemini 3 月版本>Claude4>o3>gemini 目前 6 月版本,grok3 降智过,写代码一般
    catamaran
        23
    catamaran  
       37 天前
    我用 windsurf ,使用 gemini 2.5 pro 感觉还行,这两天升级了,分了两个小版本,promo:0.75x ,thinking: 1.25x ,用 promo 跟之前比没啥区别。sonnet 3.7 没怎么用,用了 gemini 感觉提升很大,就一直没换。
    PendingOni
        24
    PendingOni  
       37 天前
    Gemini 经常是上段还正和你中文沟通 下一段就开始拽洋屁...
    drymonfidelia
        25
    drymonfidelia  
    OP
       37 天前
    @msg7086
    @youthfire 我的前一个帖子就是说 AI Studio 的 /t/1110486
    用网页版只是因为最近很多人说他们新出的 Code Canvas 功能很厉害 只有网页版才有
    我说想贴截图是因为想让他根据软件里给出的信息思考哪里出了问题,发现贴图会导致严重降智所以最后没贴
    msg7086
        26
    msg7086  
       37 天前
    @drymonfidelia 可以试试看用 Cline/Roo 之类的软件调用 Gemini 模型 API 。
    pnczk2019
        27
    pnczk2019  
       37 天前
    我就喜欢没事听 GEMINI 在那边胡说八道.就算你随便问点东西.他也能给你说一大堆.口才真的好
    xingchenxf
        28
    xingchenxf  
       37 天前
    gemini 挺强的,最近公司内组织了一个比赛,大家都是用 ai 做题的,比赛完大家总结,很多人推荐 gemini 。
    alwaysol
        29
    alwaysol  
       36 天前
    gemini 的优点就是回复快
    sillydaddy
        30
    sillydaddy  
       36 天前
    现在的大模型啊,你根本不知道它们什么时候会「降低智商」。大模型本身就是一个黑盒了,黑盒外面还要套一层黑盒。
    xiaojie668329
        31
    xiaojie668329  
       36 天前
    grok 的指令理解能力太弱了,Gemini 3 挺强的用下来
    iwknow2333
        32
    iwknow2333  
       36 天前
    今天 gemini 确实有点弱智,gemini 刚改名 pro 的那几天体验个人感觉吊打 gpt 和 claude ,还有 gemini 的 deep research 也是吊打 gpt 和 claude ,我御三家都有 plus
    goodhellonice
        33
    goodhellonice  
       36 天前
    好巧。。。我也正在用 blender ,也在用 gemini 和 grok 。。。。用 gemini 多一点,在我的场景下 gemini 更聪明点,相比 grok
    user23125
        34
    user23125  
       36 天前
    Gemini 总结 YouTube 视频还是挺好用的
    JoshTheLegend
        35
    JoshTheLegend  
       36 天前
    确实,而且感觉犟的程度比 ChatGPT 还要严重。ChatGPT 错了不肯承认的时候用脏话骂它它大部分时间都会真的重新复核自己的答案,然后告诉你它搞错了。Gemini 属于怎么骂都不肯改的,所以我现在看到它乱讲我都直接放弃了。
    sworld233
        36
    sworld233  
       36 天前
    我是买 openrouter 的额度的,基本上只有 o3 和 gemini 2.5 pro 的回答感觉能看,其他要不然太贵(如 gpt 4.5 没用过),要不然就是太弱
    billccn
        37
    billccn  
       36 天前
    我就在想,这些厂家什么时候开始卖 AI 咖啡,你付钱点了以后智商就正常一段时间,还可以引入不同品牌冠名和咖啡豆品种,每种效果不一样。
    eroneko
        38
    eroneko  
       36 天前
    Gemini Pro 2.5 03-25 刚出来那会无论是性能和价格都碾压全场,现在降智降得只能说在 AI Studio 还能凑合用用,网页/App 版从最开始就是废物,只能偶尔拿来查点东西的水平,甚至让它搜索也会有概率不听指令。
    neilxu
        39
    neilxu  
       36 天前
    终于有人说出了我的疑惑,2 、3 、4 月用 AI 研究 k8s ,主力就是 gemini ,还特意买了一个月 google one ,怎么搞都有问题。
    5 月初买了 chatgpt plus ,不到一周把问题全解决了。
    Helios5010
        40
    Helios5010  
       36 天前
    悄悄说一下,Google ONE 大伙都是白嫖的
    raphaelsoul
        41
    raphaelsoul  
       36 天前
    最近我 windsurf 一直在用 gemini 。场景是项目设计和实现。其他都还好 基本上描述比较模糊的能猜个七七八八 不合心意的指正一下就好。不过发现一个缺点。聊的多了 上下文多了 会忘记设定的使用中文的要求,开始吐英文文本。
    xygod
        42
    xygod  
       36 天前
    公司订阅的 pro, 感觉比自己订的 chatgpt plus 好用, 已取消订阅, 白嫖公司的了
    Wkj1998
        43
    Wkj1998  
       36 天前
    Gemini 会员版是最垃圾的
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2842 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 09:02 · PVG 17:02 · LAX 02:02 · JFK 05:02
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.