V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
himawari8

AI 直接写机器码目前是否可行?一朋友公司准备下半年全面开始推广机器码开发

  •  
  •   himawari8 · 6h 37m ago · 1483 views

    昨天和某大厂朋友吃饭,聊了些闲话。目前某厂是准备下半年全面开始推广机器码开发,并开始弱化,直至取消软件工程工作流。因为投资公司要求在软件开发全流程 AI 自动化,以降低风险。

    开发这块,目前主要思路是基于主流指令集和 ABI 来区分版本,暂时先复用现存的 so 库。

    软件验收和测试,已经部署好了独立的 Agent ,正确率基本可以达到 100%。

    问题定义,领域建模,组织管理,舆论引导,辅助决策,是这几个月 AI 增长最快的能力。Anthropic 和 OpenAI ,在帮助产品经理理清思路,洞悉甲方的心理、社交尺度管理等效果不错。此外,帮助管理者从错综复杂的不确定的客观世界中,把握确定的部分,并高效辅助管理人员博弈,

    举个例子,产品已经开发好对应的 prompt 和 skill,Codex 可以根据代码的版本历史,将甲方抽象为一个单独的实体,并推理其人格和对应的心理和行为。目前可以给出可用的甲方需求变更预测,甲方 UI 审美的发展(主要还是甲方领导的审美);对管理者而言,有效平衡公司各个派系的利益均衡,提升自我决策的正确性,提升领导魅力;对公司而言,不同地域的合规、税务优化、政府关系管理、市场公关,都可以使用现有的大模型快速得到最优的 to do list ,只要有一个人或者 agent 执行即可。

    理想状态是,任何个人或者资本注册一个公司,投资雇人部署好几百个 Agent 和 2-3 名管理员,即可批量构建和迭代大型软件。OPC 这个概念目前来看还是理想状态,有客户关系、有能跑通的盈利模式,才是未来的核心竞争力,Marketing 和 Manager 的含金量还在上升。这往往也是投资公司、资本管理公司较擅长的领域

    Supplement 1  ·  2h 53m ago
    @lujiaosama 运维靠 agent 的推理能力和知识库解决; AI debug 这个我也没想清楚~但是我觉得如果一定要,也可以直接往 elf 文件里多塞一些调试信息和 symbol 等,然后由 AI 封装 gdb 之类的或自己写的调试器,来辅助人类工程师调试。

    @Eillott 这种一站式解决方案已经有很多人在做了,编码工程能力能够及格,但软性能力还是差一些。比如不能说的信息不足,导致训练的模型还是不够“懂事儿”,比如必须采购哪个厂商的灭火器才能通过消防检查,过车辆年检必须去哪家修理厂,某市某区领导班子的权力布局...

    @andforce CPU 指令集,不是 intel/att assembly, 更不是高级语言或解释性语言

    @YanSeven 这么搞确实容易扯着蛋,但保守恐怕更难生存。看人家管理层怎么想了哈哈~

    @malusama 硬件、token 成本和管理员薪资,还有公司注册资本。需求和测试已经由 AI 帮人类理清,并且比人类更加精细。

    @sagnitude 一句话就是 AI 算力远超人类,人类眼中“规模庞大复杂”的软件项目在 AI 眼中或许只是“1+1=2”,“足够健壮”自然不是问题。其实健壮性本身也是相对的,bug free 是理想状态只能无限接近。如果“足够健壮”的定义是,经过 code review 和长期稳定运行的验证,那么 AI 目前也可以做到。现状是“足够健壮”的代码在 AI 看来依旧漏洞百出,anthropic 最新推出的 mythos 已经在众多流行的软件里发现了很多人类尚未发现 bug ,因此都不能对公众开放。

    @night98 之所以会出现“合理的封装以降低复杂度”这类软件工程方法,就是因为人类大脑算力不足,无法掌控规模日益庞大复杂的软件项目。进入 AI 时代,复杂度不再是问题后,猛犸象也就不需要在焦油坑里挣扎了,而只需在岸边欣赏工业化机器人如何自动化采集、运输、精炼焦油这一整套产业链的运作。你现在不需要直接看 0101 的机器语言,只需要看机器语言的说明文档:高级语言源代码,就可以了。AI 时代后,你也不需要再看源代码了,只需要看自然语言和插图分析好的业务逻辑和用例。

    @AhFei 令人一言难尽的编译器优化?还是交给 AI 统一管理吧~

    @Melanthius 说的好,上下文长度这个我也没想清楚怎么解决。现在应该有 10M 级的模型了。

    @billccn 确实是,但有没有一种可能,就是未来 debug 这种活动也是多余的了。

    @ntdll 说的有道理,现代大型软件开发牵扯面太广了,合规、HA 、稳定性、支付和安全、隐私、灾备...AI 全覆盖或许能力并不足以支撑
    37 replies    2026-05-11 23:55:14 +08:00
    v1
        1
    v1  
       6h 34m ago
    你朋友公司叫什么,送财童子我一定要认识。
    sagnitude
        2
    sagnitude  
       6h 25m ago   ❤️ 2
    这是默认 LLM 能直接一次性写出 gcc 级别的健壮代码?
    lujiaosama
        3
    lujiaosama  
       6h 17m ago
    生产也靠 AI DEBUG 吗
    chandler0149
        4
    chandler0149  
       6h 15m ago
    没看懂
    strobber16
        5
    strobber16  
       6h 14m ago
    冲,再不冲 LLM API 就要涨价了
    himawari8
        6
    himawari8  
    OP
       6h 13m ago
    @sagnitude 不好说,但“健壮”这一需求的根源,在于人类大脑的局限性。如果这一问题不复存在了,本世代的软件工程就可以成为历史了。Next-Level Software Engineer 是基于 AI Agent 协作的,或许内容和当代软件工程查不多,但当前人类在用的软件规模看,对 AI Agent 来说或许还很小儿科,“硅基码农”单打独斗就能搞定。
    longaiwp
        7
    longaiwp  
       6h 12m ago   ❤️ 22
    看起来人类的幻觉也没比大模型更低啊
    Eillott
        8
    Eillott  
       6h 10m ago via iPhone
    非常不错的 idea ,建议赶紧落地不然被别人抢先了!时不我待!
    hhhfhhf
        9
    hhhfhhf  
       6h 5m ago
    @longaiwp 哈哈哈,明天就快进到不写程序了,AI 直接操作内存和显存
    mqnu00
        10
    mqnu00  
       6h 5m ago
    @longaiwp 你这句话太好笑了
    ktyang
        11
    ktyang  
       6h 5m ago
    必须立刻开展,建议投资公司跳过投资,直接原地解散某厂。
    andforce
        12
    andforce  
       5h 59m ago via iPhone
    你说的机器码,是我理解的那个通用的机器码吗?
    YanSeven
        13
    YanSeven  
       5h 59m ago
    机器码开发的意思就是人类完全无法参与研发与 debug 了,那前置步骤不应该是在高级语言的场景下做到完全无人化吗。

    这么搞不怕步子太大扯到蛋吗。
    malusama
        14
    malusama  
       5h 51m ago
    扯那么多, 能接受一个软件开发成本是多少钱嘛。。测试覆盖率是多少嘛
    sagnitude
        15
    sagnitude  
       5h 46m ago
    @himawari8 健壮需求是人类的局限性,你的意思是 AI 跑程序,崩了也无所谓吗
    7beloved
        16
    7beloved  
       5h 41m ago
    这个问题为什么不让你朋友来问
    w568w
        17
    w568w  
       5h 29m ago
    何意味
    night98
        18
    night98  
       5h 28m ago
    可行个鸡毛,计算机的魅力就在于合理的封装以降低复杂度;
    AhFei
        19
    AhFei  
       5h 25m ago via Android
    抽象是为了简化,即便 AI 越过奇点,也没有必要没苦硬吃吧。就好比有加工中心却硬要工人拿锉刀去制造。

    高级语言不只是为了人类可读,其本身的约束就能避免很多错误,况且编译器优化可以不断改进,如果真有必要写机器码,那也可以分而治之。再者,如果硬件改动,全重写吗?
    qazwsxkevin
        20
    qazwsxkevin  
       5h 16m ago
    挺好的,炼出来的成果,少了很多套接套,件接件的屁事,间接依赖过程造成的性能开销,全要回来了,给到正事业务去了,事能把硬件资源全给正事吃,计算机本来就应该如此啊
    honjow
        21
    honjow  
       5h 9m ago
    怕不是想多了
    bkmi
        22
    bkmi  
       5h 3m ago via Android
    楼上的不知道有啥好嘲笑的,两年前还一群人嘲笑 AI 写代码呢
    remarrexxar
        23
    remarrexxar  
       5h 0m ago
    AI 解决了软件工程领域缺乏民科的问题
    Melanthius
        24
    Melanthius  
       4h 57m ago
    目前 AI 能做的事情会受限于上下文长度,所以工程上一直需要优化上下文。

    怎么说呢,直觉上直接生成机器码上下文会爆炸,相比编程语言+框架这种组合,抽象能力不太行。
    billccn
        25
    billccn  
       4h 47m ago
    有经验的人类用高级语言加各种人工、静态、动态检查还能写出问题百出的底层软件;目前的 AI 各种幻觉、遇到复杂的问题脑子也不是很灵光,让它直接写机器码?

    这种东西先不说难以 debug ,就连 stack trace 都没有意义,全是 AI 生成的函数名,要不改成显示:“用户于某年某月某日的某某 prompt 里面有逻辑错误”?或者说干脆不 debug ,遇到错了重新生成一个,换个完全不同的方法崩溃?
    tairan2006
        26
    tairan2006  
       4h 32m ago
    不可以,你特么不用审计了是吧
    ETiV
        27
    ETiV  
       4h 24m ago via iPhone
    我也觉得这是必然的未来
    AI 写高级语言、低级语言只是暂时的,未来会直接产出 JVM 字节码、CPU 汇编…
    就像 AlphaGo ,会下出人看不懂的棋路,但一样能赢一样。
    在追求效率的社会,让 AI 干活儿,其实没有让人懂的义务。
    nVoxel
        28
    nVoxel  
       4h 21m ago via Android
    看这种积极的态度盲猜字节
    crocoii
        29
    crocoii  
       4h 11m ago via Android
    到那时就没人类啥事了。ai 掌握世界,人类是抵抗组织了。参照终结者。
    MuyuQ
        30
    MuyuQ  
       3h 57m ago
    @ETiV 还写 JVM 和汇编干嘛。。反正人类审不过来,让 AI 直接写 1 和 0 不是更好。。
    ntdll
        31
    ntdll  
       3h 57m ago
    我认为可行性极低,现阶段 Vibe Coding ,如果把编译器砍掉,让 AI 盲写,那是几乎没有跑起来的可能,全靠编译器做强制检查。各种 SKILL 也是人为上各种限制条件。

    而低级语言的编译器就简单得多了,几乎可以认为对 AI 起不到任何帮助作用,跑起来大概率也就是空转,写不出任何可用的东西,最后变成了 Authentic/OpenAI/Google 战略合作伙伴。

    退一万步,就是 AI 写出来了,调试呢,也自己写个调试器出来吗,个人认为 [要求在软件开发全流程 AI 自动化,以降低风险] ,这才是最大的风险。

    现阶段的 AI 只是拔高了下限,让本来啥也不会的人,能写个小玩具,原本能写小玩具的人,能写个有生产能力的工具,但并没有改变上限。

    你说让 AI 搓个成熟的商业软件,比如搓个 QQ 出来,也许能实现个基本功能,也能抄个 UI ,但也还是玩具,我不认为靠 AI ,或者少数几个人+AI 的组合,能做出来一个承载上亿人使用的商业软件。
    extrem
        32
    extrem  
       3h 15m ago
    马斯克之前就提出过了,应该是说今年年底还是什么时候,ai 直接产出机器码而不是高级语言代码

    我认为这不是不可能,而且显然效率更高

    但应该不是今天能做到的,因为现在大模型能 work 这是因为互联网上有无数的语料能给他练出来了,然而汇编/机器码少之又少,人话与汇编代码合在一起的语料更是罕见,所以这是打标都没法打,哪来的 ai 按照你的需求去生成能跑的机器码

    你可以做个实验,要求 ai 用个冷门语言,比如 Elixir 、erlang 去写个稍微有点难度的 demo 看看,再对比 python ,看看后者是否效率更高
    ETiV
        33
    ETiV  
       2h 56m ago
    @MuyuQ 打比方而已…
    用来表达从高级语言到更低级语言的演进方向,当然最后都是 0 和 1 就是了
    MuyuQ
        34
    MuyuQ  
       2h 30m ago
    @ETiV 这个想法太扯淡了。 本身 AI 就是黑箱。让它直接写低级语言,那就是黑箱+黑箱,完全不可控了。如果在里面加一点私货,人类根本无法识别。
    kuhung
        35
    kuhung  
       2h 24m ago
    AI native 玩疯魔了,不尊重客观事实和工程原理的人,等着火箭爆炸吧
    ppxppx
        36
    ppxppx  
       1h 51m ago via Android
    我觉得做个 AI 的优化编译器还更有可行度,起码有现成的编译器和代码库可以作为验证。直接生成机器码步子怕不是太大了。
    tootfsg
        37
    tootfsg  
       1h 29m ago via Android
    这很明显,是水硬币来了,还真有人上当,一本正经的讨论。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1281 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 121ms · UTC 17:24 · PVG 01:24 · LAX 10:24 · JFK 13:24
    ♥ Do have faith in what you're doing.