如题,在北美一家偏传统的科技公司当苦力,基础、安全和应用三头管的 Corporate 架构师。这几年实在是干伤了,上月提了离职,这月底正式滚蛋。接下来的离职生活主打一个养生,打算歇个一年半载,把静息心率调下来,顺便修一修脂肪肝和肾结石。
空档期不打算彻底闲着,手里有几个跑了很久、已经对外收费的冷门服务准备高强度迭代一波,还想再折腾点新工具。虽然是做架构出身,但实际职业生涯里亲自手搓代码的日子也就占个 10% 左右,所以接下来的开发得重度依赖 AI 帮我干活,包括撸代码、debug 和重构。
介绍下目前的使用场景: 我自己写了一个 24x7 自动开发测试上线的框架,DeepSeek 直接挂在里面跑。算了一下单日平均大概 3.3 亿 token ,4500 次左右的请求。这块因为缓存命中率极高( 97% 左右),跑得挺稳,成本跟土一样便宜。虽然它效率相比很低,但好在便宜又会自动纠错,平时不用我操心,出来的 Web 或其他 GUI 的最终成品一般很丑,最终我会再半手动去完善一下 UI/UX 。
现在纠结的是前台交互: 以前在公司习惯了企业版 Copilot 和原厂 API 无限随便造,导致我对各大厂商针对个人的 Coding Plan 真是不太了解。自己有个 Google AI Pro (公司报销),但那个限额简直是一言难尽,白嫖都嫌碍事,刚给降级关了。当然,如果大伙觉得它家那个 Ultra 档位确实能打,我也考虑再开回来。
离职后每天会有大把时间跟 AI 高频对话,算是典型的高强度场景。想请教下各位,先不聊 Cursor 或者 Windsurf 这些壳子,只看底层模型的大杯订阅(比如 Claude 的 Pro/Max 档,或者 OpenAI 的高阶订阅),买哪家最不容易降智?如果能量大管饱到可以让我低成本替换掉后台 24 小时跑的 DeekSeek API 那就最好了。
最核心的诉求:千万别写到一半突然给我卡限流,或者用着用着模型就变笨了。
(月底离职那天会去搞个 64G RAM 的 M5 Pro 顶配,但不打算用来跑常驻的 LLM)
求个有类似高强度实战经验的老哥给点建议,先谢过各位。
1
sNullp 11 天前 via iPhone 不打算搞个 rtx pro 6000 跑个 32B 模型嘛
|
2
sddyzm 11 天前 via iPhone 说实在的休息就休息
|
4
kenshinhu 11 天前 哥,需要人手不,求點 Agent 的项目经验
|
5
germain OP @kenshinhu 我是离职啊兄弟,不是创业,雇不起人,更谈不上什么 Agent 项目经验,所谓的经验也只是烧钱烧出来的教训而已(没少花公司钱烧 API 和 Microsoft Foundry 在毫无意义的项目上面)。
|
6
imnpc 11 天前 目前来说 大杯的都很贵 200 刀左右?
建议去看下 oh-my-openagent 基于 opencode 的插件 能灵活调度和分配不同的 AI 来协调工作 类似 Trae 的 SOLO 模式 这个工具的目的是用尽量少的成本 来实现最好的 AI 生成效果 https://ohmyopenagent.com/ https://github.com/code-yeongyu/oh-my-openagent 默认给出的方案 可以根据自己的需求买更大的方案 ChatGPT Subscription ($20) Kimi Code Subscription ($15) GLM Coding Plan ($10) 我目前是用的以下方案 1.Codex team (GPT 5.3 Codex) -- 10 元/每月 闲鱼买的 2.Gemini for students -- 免费 1 年 3.GLM Coding Plan Lite -- 年付 4.百度千帆(MiniMax-M2.5/GLM5/DeepSeek-V3.2/Kimi-K2.5) -- 7.9 元/首月,次月 20 元/月 后面 40 元/月 |
7
germain OP @imnpc 多谢,我目前使用的 orchestrator 和 ohmyopencode 类似,但是在 cache hit 的优化上借鉴了更多 claude code 的思路,基本能做到 cache hit rate 在 96%以上(非 think)。并且特别为我这种懒人优化了长任务/不中断任务的运行机制,agent team 的微调也更激进。
你提到的几个国内的,我现在只在用 deepseek-chat (码农)和 deepseek-reasoner(special api,处理数据,项目规划以及复杂逻辑),性价比非常高,就像我原文提到的,这个是我一直 24x7 跑的 API 。 不过在这个基础上我还得买个诸如 Claude Max 5x 的大碗,就是不知道哪几个大碗的限额最宽松。个人是偏向 Claude ,但是 Google AI Ultra 也能用 Opus ,只是不确定哪个更量大管饱。 |
9
zfjdif 11 天前 推荐 codex $200 的
|
10
germain OP |
11
genuifx 6 天前
opus 4.6 和 codex 把
|
13
genuifx 6 天前
@germain 我感觉把任务做对更重要,给 AI 擦屁股太难受了,codex 规划 cc 复查,然后两个随便一个实施,另外一个复核 review , 我自己实践下来是比较不容易出错的
|
14
germain OP @genuifx 完全同意,所以我把注意力从做任务里跳出来,花大力气在 plan (前期)和 debug (后期)阶段(用 CC+Codex+Gemini),再用白菜价的 Deepseek 写出雏形,然后再用 CC 和 Codex 优化。而不是人工给 AI 擦屁股。人工大多数是去调整 rules 和实际使用中的 context window 的优化,以及 sub-agents 的任务分配。
|