MZSAN 最近的时间轴更新
MZSAN

MZSAN

V2EX 第 532277 号会员,加入于 2021-02-06 09:13:56 +08:00
MZSAN 最近回复了
做手术,去手部汗腺~
11 天前
回复了 selectAndAction 创建的主题 程序员 有 v 友用 bard 的吗
申请早过了,但 bard 不支持中文,能力相比 gpt 和 newbing 没有优势,既然如此 为何不直接用 gpt 和 claude 呢,哪怕是百度 ai 搜索都比 ta 好用🤔
有没有可能是因果搞反了呢?不常刷牙的人,对于个人的医疗卫生健康大概率也不甚在意,因而会有导致这样统计学上的偏差。
另外也别觉得 Reallity 就能解决问题,目前已经可直接通过 DNS 来检查访问 IP 是否属于所声称的域名。偷域名的方案 reallity/shadowtls/restls 一概通杀。。
https://github.com/3andne/restls/issues/8
这个程序写得很简单,只是简单检测一下大小 套个 grpc 可暂时缓解,但特征依旧存在。
实际上,Trojan tls in tls 的 client hello 特征非常明显。而理论上所有 TLS in TLS 都可以监测,并且由于 TLS IN TLS 的特征几乎只会在代理中出现,误杀有但较少,所以不排除特殊时期 GFW 会采用这种相对激进的监测手法。
19 天前
回复了 MZSAN 创建的主题 OpenAI 尝试了讯飞的星火大模型后的感受分享~
19 天前
回复了 MZSAN 创建的主题 OpenAI 尝试了讯飞的星火大模型后的感受分享~
看刚刚官方公告的解释,确实是出现了星火大模型在训练时被 chatGPT 数据大范围污染的问题,而具体是被网络数据污染还是训练过程中直接套了 ShareGPT 以及类似的数据集,就不得而知了。不过对比隔壁文心一言的表现,星火大模型后者的可能性比较大。
个人测试下,,总的来说 讯飞的模型在问题理解上经常会犯常识性的错误,而且会在回答过程中自己就偏了题(这个效果和 gpt2 很类似)。此外,讯飞的回答总是十分宽泛,有一种说了也是白说的感 jio~

星火似乎对某些常问的问题提前设定好了,举个例子 问它一棵树上有 10 只鸟打死一只还有几只 它能答的不错,而把 10 换成 114514 就开始胡言乱语了。

说实话,试用了几次星火大模型后 已经没了兴趣。ta 的能力偏弱,也没有文生图之类的附加能力。。给我的感觉,ta 可能就是个在开源的 llama 模型基础上进行的魔改~

另外我在对话过程中也多次问出了漏洞,,似乎发觉星火大模型是在回答输出时 检测是否有涉及到敏感信息或询问其开发公司等回复,检测到后进行替换(哪怕是答非所问)。虽然是小概率,但不能排除 gpt 套壳的可能。

另外也有一个极大的可能,讯飞在训练模型时 使用了 ShareGPT 或其它类似的 GPT 对话数据集,导致了当下星火大模型所出现的回答逻辑与 ChatGPT 相像、询问开发信息时答复 OpenAI 等等问题。

如果星火大模型确是在数据来源上大量取自 chatGPT 的对话,一方面这在最终呈现的效果上又成了另一种形式的套壳,另一方面该模型的文本质量必定是低于 chatGPT 的,更别提超越了。。。
关于   ·   帮助文档   ·   博客   ·   nftychat   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3130 人在线   最高记录 5634   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 34ms · UTC 00:48 · PVG 08:48 · LAX 17:48 · JFK 20:48
Developed with CodeLauncher
♥ Do have faith in what you're doing.