WuSiYu

WuSiYu

V2EX 第 117744 号会员,加入于 2015-05-19 20:37:14 +08:00
今日活跃度排名 17349
根据 WuSiYu 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
WuSiYu 最近回复了
m4 单核是 m1 的 1.5 倍,有时候还是能有点区别
4 天前
回复了 desususula 创建的主题 Apple Mac 上大家都用什么浏览器?
firefox 换 zen ,最后换到 arc 了。。。
7 天前
回复了 LUO12826 创建的主题 MacBook Pro M1 Pro 用户换 M4 Pro 的感受和碎碎念
我是 m1 ( mbp13 2020 )换 m4p ,感觉还是很爽的
不过单核这个确实,日常使用时区别不大,只有软件冷启动或者处理东西时感知明显
7 天前
回复了 Unclev21x 创建的主题 Apple 苹果刚刚推出了新款 Mac Studio
@WuSiYu 打错了,前面是 q4
7 天前
回复了 Unclev21x 创建的主题 Apple 苹果刚刚推出了新款 Mac Studio
@icyalala 算了下,都 q6 量化的话,只考虑权重访存,70b dense 模型(如 qwen )的理论极限是 20+ token/s ,R1 671B 的 moe 模型,每次激活 37B 参数,理论极限 40+ token/s ,实际考虑计算和 context 大概折半,用 q6 等量化还要打折

不算不能用,但也不算快,100b+的模型只能推 moe 的,但 moe 模型恰恰就是大规模场景才能把成本降下来(冗余专家并行)。所以除非有涉密需求,不如与其 7w+买个这,还是租 API 比较划算
8 天前
回复了 Unclev21x 创建的主题 Apple 苹果刚刚推出了新款 Mac Studio
512 对 LLM 负载意义不大了,对于这个量级的 memory ,mac 的 memory bandwidth 和 gpu peak flops 都不太够看,用人话说就是跑更大的模型能跑但慢到没法用
建议两边都及时止损
12 天前
回复了 yiqiu2324 创建的主题 macOS 访问 raycast 官网,会导致 CPU 和 GPU 狂转..
M4 Pro 能复线,虽然短时间风扇没起飞,但能看到 GPU 跑满了,整机功耗从 10w 上升到 30w+
这玩意是 three.js 做的,相当于浏览器里跑个游戏
带英连高级数据保护都不让用了?那岂不是还不如。。。
国内其实不少原厂或能直刷 openwrt 的:gl inet ,banana pi ,cudy TR3000 (这个贼便宜)
mt789x 方案现在 openwrt 上的硬件 nat 支持很成熟,等同于硬路由了
但其实你跑 wg 的话总归是要吃 cpu ,软硬路由没啥太大区别
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1173 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 10ms · UTC 23:17 · PVG 07:17 · LAX 16:17 · JFK 19:17
Developed with CodeLauncher
♥ Do have faith in what you're doing.