V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  fnd  ›  全部回复第 2 页 / 共 12 页
回复总数  229
1  2  3  4  5  6  7  8  9  10 ... 12  
别买华为,Pura 60 最贵的那个版本,10999 ,不值这个价。打游戏有点烫。
输入法搞得鬼,x 信自己搞输入法也有这层考虑,总有人说是 x 信监听这个监听那个,实际上是输入法收集然后售卖的。
308 天前
回复了 CatCode 创建的主题 汽车 不懂车,怎么学习?
@luvsic 7 、8 的样子吧
308 天前
回复了 CatCode 创建的主题 汽车 不懂车,怎么学习?
M7 车主在此,有啥疑问欢迎交流
上面说的都太业余了,说点实际的。

首先,100 个人用≠100 并发,要结合你的业务场景去评估实际需要支持多少并发。比如:每个人是时时刻刻一直用?还是 5%的时间段在用?重合度多少?峰值可能是多少?
其次,现在并发数的成本很高,并不是一定要支持峰值的并发。当前业内通用的做法是只支持特定的并发,然后做一个队列进行并发控制。如果并发满了一定数量内的先队列等待,等待队列也满了就提示并发数超限稍后再试之类的。
然后,4090 就先不说并发了,70b 的模型都不一定能跑起来,可能得上 A100 。

实际并发数的计算得看单卡每秒 tokens ,然后根据业务场景预估单次请求可能的 tokens 大小,计算得到单卡并发。
你们的后端太懒了。就你说的这些情况,需要有一个专门的业务后台来做这些接口的整合,而不是客户端做这些事情。
置身事内
纳瓦尔宝典
新能源也能挂蓝牌的吧
2024-02-18 11:27:25 +08:00
回复了 DelayNoMay 创建的主题 职场话题 想跳槽, 2024 的就业环境会好一点吗?
不会
@KKLeon 断断续续的,投入度不够。有兴趣一起搞?
2023-12-08 16:43:31 +08:00
回复了 92Developer 创建的主题 程序员 海外副业彻底绝路后续
独立开发副业交流群求拉~
2023-12-07 10:13:41 +08:00
回复了 GCP 创建的主题 程序员 各位久坐的程序员,你们都买哪个人体工学椅?
预算够直接 Herman Miller ,但是我预算也不够...
我买的京东京造 z9 smart ,坐起来也很舒服,对我而言没感觉比 Herman Miller 差太多,够用,带腰托脚托也很舒服~
2023-11-30 10:46:09 +08:00
回复了 Spidercut 创建的主题 投资 30-50w 买什么投资产品好
当前这个时间点,大 A 。不用等太久,最晚春节后,至少会有一波行情,最好止盈就风险不大。
小红书的粉丝比抖音还多?是主要精力用于小红书运营了吗?
2023-11-27 14:12:26 +08:00
回复了 nightnotlate 创建的主题 问与答 给妻子的三十岁生日礼物 送什么呢
戴森吹风机,大大提高吹头发体验
请教下,你这个内容生成的服务器是部署在哪里的?为啥会是静态网站?
1  2  3  4  5  6  7  8  9  10 ... 12  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3491 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 38ms · UTC 04:53 · PVG 12:53 · LAX 21:53 · JFK 00:53
Developed with CodeLauncher
♥ Do have faith in what you're doing.