AI 直接写机器码目前是否可行？一朋友公司准备下半年全面开始推广机器码开发

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

For Existing Member Sign In

昨天和某大厂朋友吃饭，聊了些闲话。目前某厂是准备下半年全面开始推广机器码开发，并开始弱化，直至取消软件工程工作流。因为投资公司要求在软件开发全流程 AI 自动化，以降低风险。

开发这块，目前主要思路是基于主流指令集和 ABI 来区分版本，暂时先复用现存的 so 库。

软件验收和测试，已经部署好了独立的 Agent ，正确率基本可以达到 100%。

问题定义，领域建模，组织管理，舆论引导，辅助决策，是这几个月 AI 增长最快的能力。Anthropic 和 OpenAI ，在帮助产品经理理清思路，洞悉甲方的心理、社交尺度管理等效果不错。此外，帮助管理者从错综复杂的不确定的客观世界中，把握确定的部分，并高效辅助管理人员博弈，

举个例子，产品已经开发好对应的 prompt 和 skill,Codex 可以根据代码的版本历史，将甲方抽象为一个单独的实体，并推理其人格和对应的心理和行为。目前可以给出可用的甲方需求变更预测，甲方 UI 审美的发展（主要还是甲方领导的审美）；对管理者而言，有效平衡公司各个派系的利益均衡，提升自我决策的正确性，提升领导魅力；对公司而言，不同地域的合规、税务优化、政府关系管理、市场公关，都可以使用现有的大模型快速得到最优的 to do list ，只要有一个人或者 agent 执行即可。

理想状态是，任何个人或者资本注册一个公司，投资雇人部署好几百个 Agent 和 2-3 名管理员，即可批量构建和迭代大型软件。OPC 这个概念目前来看还是理想状态，有客户关系、有能跑通的盈利模式，才是未来的核心竞争力，Marketing 和 Manager 的含金量还在上升。这往往也是投资公司、资本管理公司较擅长的领域

Supplement 1 · 2h 53m ago

@lujiaosama 运维靠 agent 的推理能力和知识库解决； AI debug 这个我也没想清楚～但是我觉得如果一定要，也可以直接往 elf 文件里多塞一些调试信息和 symbol 等，然后由 AI 封装 gdb 之类的或自己写的调试器，来辅助人类工程师调试。

@Eillott 这种一站式解决方案已经有很多人在做了，编码工程能力能够及格，但软性能力还是差一些。比如不能说的信息不足，导致训练的模型还是不够“懂事儿”，比如必须采购哪个厂商的灭火器才能通过消防检查，过车辆年检必须去哪家修理厂，某市某区领导班子的权力布局...

@andforce CPU 指令集，不是 intel/att assembly, 更不是高级语言或解释性语言

@YanSeven 这么搞确实容易扯着蛋，但保守恐怕更难生存。看人家管理层怎么想了哈哈～

@malusama 硬件、token 成本和管理员薪资，还有公司注册资本。需求和测试已经由 AI 帮人类理清，并且比人类更加精细。

@sagnitude 一句话就是 AI 算力远超人类，人类眼中“规模庞大复杂”的软件项目在 AI 眼中或许只是“1+1=2”，“足够健壮”自然不是问题。其实健壮性本身也是相对的，bug free 是理想状态只能无限接近。如果“足够健壮”的定义是，经过 code review 和长期稳定运行的验证，那么 AI 目前也可以做到。现状是“足够健壮”的代码在 AI 看来依旧漏洞百出，anthropic 最新推出的 mythos 已经在众多流行的软件里发现了很多人类尚未发现 bug ，因此都不能对公众开放。

@night98 之所以会出现“合理的封装以降低复杂度”这类软件工程方法，就是因为人类大脑算力不足，无法掌控规模日益庞大复杂的软件项目。进入 AI 时代，复杂度不再是问题后，猛犸象也就不需要在焦油坑里挣扎了，而只需在岸边欣赏工业化机器人如何自动化采集、运输、精炼焦油这一整套产业链的运作。你现在不需要直接看 0101 的机器语言，只需要看机器语言的说明文档：高级语言源代码，就可以了。AI 时代后，你也不需要再看源代码了，只需要看自然语言和插图分析好的业务逻辑和用例。

@AhFei 令人一言难尽的编译器优化？还是交给 AI 统一管理吧～

@Melanthius 说的好，上下文长度这个我也没想清楚怎么解决。现在应该有 10M 级的模型了。

@billccn 确实是，但有没有一种可能，就是未来 debug 这种活动也是多余的了。

@ntdll 说的有道理，现代大型软件开发牵扯面太广了，合规、HA 、稳定性、支付和安全、隐私、灾备...AI 全覆盖或许能力并不足以支撑

自动化

软件

管理

37 replies • 2026-05-11 23:55:14 +08:00

6h 34m ago

你朋友公司叫什么，送财童子我一定要认识。

sagnitude

6h 25m ago

这是默认 LLM 能直接一次性写出 gcc 级别的健壮代码？

lujiaosama

6h 17m ago

生产也靠 AI DEBUG 吗

chandler0149

6h 15m ago

没看懂

strobber16

6h 14m ago

冲，再不冲 LLM API 就要涨价了

himawari8

6h 13m ago

@sagnitude 不好说，但“健壮”这一需求的根源，在于人类大脑的局限性。如果这一问题不复存在了，本世代的软件工程就可以成为历史了。Next-Level Software Engineer 是基于 AI Agent 协作的，或许内容和当代软件工程查不多，但当前人类在用的软件规模看，对 AI Agent 来说或许还很小儿科，“硅基码农”单打独斗就能搞定。

longaiwp

6h 12m ago

看起来人类的幻觉也没比大模型更低啊

Eillott

6h 10m ago via iPhone

非常不错的 idea ，建议赶紧落地不然被别人抢先了！时不我待！

hhhfhhf

6h 5m ago

@longaiwp 哈哈哈，明天就快进到不写程序了，AI 直接操作内存和显存

mqnu00

6h 5m ago

@longaiwp 你这句话太好笑了

ktyang

6h 5m ago

必须立刻开展，建议投资公司跳过投资，直接原地解散某厂。

andforce

5h 59m ago via iPhone

你说的机器码，是我理解的那个通用的机器码吗？

YanSeven

5h 59m ago

机器码开发的意思就是人类完全无法参与研发与 debug 了，那前置步骤不应该是在高级语言的场景下做到完全无人化吗。

这么搞不怕步子太大扯到蛋吗。

malusama

5h 51m ago

扯那么多，能接受一个软件开发成本是多少钱嘛。。测试覆盖率是多少嘛

sagnitude

5h 46m ago

@himawari8 健壮需求是人类的局限性，你的意思是 AI 跑程序，崩了也无所谓吗

7beloved

5h 41m ago

这个问题为什么不让你朋友来问

w568w

5h 29m ago

何意味

night98

5h 28m ago

可行个鸡毛，计算机的魅力就在于合理的封装以降低复杂度；

AhFei

5h 25m ago via Android

抽象是为了简化，即便 AI 越过奇点，也没有必要没苦硬吃吧。就好比有加工中心却硬要工人拿锉刀去制造。

高级语言不只是为了人类可读，其本身的约束就能避免很多错误，况且编译器优化可以不断改进，如果真有必要写机器码，那也可以分而治之。再者，如果硬件改动，全重写吗？

qazwsxkevin

5h 16m ago

挺好的，炼出来的成果，少了很多套接套，件接件的屁事，间接依赖过程造成的性能开销，全要回来了，给到正事业务去了，事能把硬件资源全给正事吃，计算机本来就应该如此啊

honjow

5h 9m ago

怕不是想多了

bkmi

5h 3m ago via Android

楼上的不知道有啥好嘲笑的，两年前还一群人嘲笑 AI 写代码呢

remarrexxar

5h 0m ago

AI 解决了软件工程领域缺乏民科的问题

Melanthius

4h 57m ago

目前 AI 能做的事情会受限于上下文长度，所以工程上一直需要优化上下文。

怎么说呢，直觉上直接生成机器码上下文会爆炸，相比编程语言+框架这种组合，抽象能力不太行。

billccn

4h 47m ago

有经验的人类用高级语言加各种人工、静态、动态检查还能写出问题百出的底层软件；目前的 AI 各种幻觉、遇到复杂的问题脑子也不是很灵光，让它直接写机器码？

这种东西先不说难以 debug ，就连 stack trace 都没有意义，全是 AI 生成的函数名，要不改成显示：“用户于某年某月某日的某某 prompt 里面有逻辑错误”？或者说干脆不 debug ，遇到错了重新生成一个，换个完全不同的方法崩溃？

tairan2006

4h 32m ago

不可以，你特么不用审计了是吧

ETiV

4h 24m ago via iPhone

我也觉得这是必然的未来
AI 写高级语言、低级语言只是暂时的，未来会直接产出 JVM 字节码、CPU 汇编…
就像 AlphaGo ，会下出人看不懂的棋路，但一样能赢一样。
在追求效率的社会，让 AI 干活儿，其实没有让人懂的义务。

nVoxel

4h 21m ago via Android

看这种积极的态度盲猜字节

crocoii

4h 11m ago via Android

到那时就没人类啥事了。ai 掌握世界，人类是抵抗组织了。参照终结者。

MuyuQ

3h 57m ago

@ETiV 还写 JVM 和汇编干嘛。。反正人类审不过来，让 AI 直接写 1 和 0 不是更好。。

ntdll

3h 57m ago

我认为可行性极低，现阶段 Vibe Coding ，如果把编译器砍掉，让 AI 盲写，那是几乎没有跑起来的可能，全靠编译器做强制检查。各种 SKILL 也是人为上各种限制条件。

而低级语言的编译器就简单得多了，几乎可以认为对 AI 起不到任何帮助作用，跑起来大概率也就是空转，写不出任何可用的东西，最后变成了 Authentic/OpenAI/Google 战略合作伙伴。

退一万步，就是 AI 写出来了，调试呢，也自己写个调试器出来吗，个人认为 [要求在软件开发全流程 AI 自动化，以降低风险] ，这才是最大的风险。

现阶段的 AI 只是拔高了下限，让本来啥也不会的人，能写个小玩具，原本能写小玩具的人，能写个有生产能力的工具，但并没有改变上限。

你说让 AI 搓个成熟的商业软件，比如搓个 QQ 出来，也许能实现个基本功能，也能抄个 UI ，但也还是玩具，我不认为靠 AI ，或者少数几个人+AI 的组合，能做出来一个承载上亿人使用的商业软件。

extrem

3h 15m ago

马斯克之前就提出过了，应该是说今年年底还是什么时候，ai 直接产出机器码而不是高级语言代码

我认为这不是不可能，而且显然效率更高

但应该不是今天能做到的，因为现在大模型能 work 这是因为互联网上有无数的语料能给他练出来了，然而汇编/机器码少之又少，人话与汇编代码合在一起的语料更是罕见，所以这是打标都没法打，哪来的 ai 按照你的需求去生成能跑的机器码

你可以做个实验，要求 ai 用个冷门语言，比如 Elixir 、erlang 去写个稍微有点难度的 demo 看看，再对比 python ，看看后者是否效率更高

ETiV

2h 56m ago

@MuyuQ 打比方而已…
用来表达从高级语言到更低级语言的演进方向，当然最后都是 0 和 1 就是了

MuyuQ

2h 30m ago

@ETiV 这个想法太扯淡了。本身 AI 就是黑箱。让它直接写低级语言，那就是黑箱+黑箱，完全不可控了。如果在里面加一点私货，人类根本无法识别。

kuhung

2h 24m ago

AI native 玩疯魔了，不尊重客观事实和工程原理的人，等着火箭爆炸吧

ppxppx

1h 51m ago via Android

我觉得做个 AI 的优化编译器还更有可行度，起码有现成的编译器和代码库可以作为验证。直接生成机器码步子怕不是太大了。

tootfsg

1h 29m ago via Android

这很明显，是水硬币来了，还真有人上当，一本正经的讨论。