GreenHand

GreenHand

V2EX 第 22077 号会员,加入于 2012-06-09 22:18:32 +08:00
If you wanna make the world a better place, take a look at yourself, and then make a change.
根据 GreenHand 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
GreenHand 最近回复了
46 天前
回复了 zhh2271 创建的主题 问与答 有没有熟悉大模型开发的, help!
建议先评估。在公司内收集一批带 groundtruth 的题目,找几个最好的模型,用盲评评估下结果,看哪些模型最好。可选的就 deepseek 、claude 4 sonnet 、codex (既然提到规则编写,默认就把 coding sota 模型加进来了),其它认为效果不错的模型。这里分两批模型:可落地的模型和 sota 模型。

决定是否训练模型。基于可落地模型和 sota 模型的效果评估和差距,决定是否要训练模型。最好的情况是可落地的模型( deepseek 、qwen3 、doubao-1.5 等)效果就不错了,直接用(不考虑数据泄露)或者买 gpu 自己部署(数据安全)。

如果差距较大且对效果不满意,需要考虑训练模型,确定如何训练,蒸馏、sft 、rft 等。这条路比上面的成本就高多了,需要考虑准备数据、制定评估标准、评估、训练,甚至数据飞轮。你们公司大概率是没有训练平台,需要找一个。整个过程,一个人是搞不定的。

最后模型效果好了,才考虑落地。

建议先评估下 roi ,是否值得做。评估下「大模型可以回答当前我们软件的一些流程怎么进行,最好可以实现一些 DRC/LVS 规则文件的编写什么的」能够带来多大的收益,是否值得投入对应的成本。
简单的 PE 估计效果一般,需要后训练模型
172 天前
回复了 jiang1209 创建的主题 求职 上海 7 年后端求捞,有老哥可以内推下吗
字节那么确认,不考虑内部活水么?是不想再字节呆了吧

另外,这薪资要求,让我怀疑帖子的真实性
我记得十年前我们单表就存了 10 亿级别的数据了
@itskingname 感觉你和老板之间的沟通出了问题。

站在老板的角度想,公司有技术团队,如果遇到技术问题,还要去外面找专家、请专家吃饭,是很累很费时间的,我猜他不一定想做这个事。很明显,他对技术团队缺乏信任感。

多沟通,通过一些 case 重建老板对你们的信心。

结合你说你们用了很多先进的技术老板不知道,需要多一些汇报,让老板了解你们在做什么。
345 天前
回复了 eggt 创建的主题 问与答 我 30 多岁,已经被后生们叫老古董了
如果她们不在意,为什么她们要求娃跟母亲姓呢?如果她们在意,要求你不在意,就是双标了吧
说谁丑呢?
362 天前
回复了 ygweric 创建的主题 OpenAI "通义灵码"和"Github Copilot" 差距大吗?
@Rennen 我感觉是用法的问题,需要先通过注释描述清楚这个类要做什么
买充电快的,比如小鹏
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2465 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 10ms · UTC 05:10 · PVG 13:10 · LAX 22:10 · JFK 01:10
Developed with CodeLauncher
♥ Do have faith in what you're doing.