V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  uprit  ›  全部回复第 1 页 / 共 18 页
回复总数  360
1  2  3  4  5  6  7  8  9  10 ... 18  
泄露的渠道多了去了,京东淘宝甚至你家物业,都会卖你电话号码,信息还会被转卖好几道。陌生电话有啥好就纠结的。管它啥开头的,400 开头、9 开头的 5 位短号,不认识的一律当垃圾广告。
25 天前
回复了 wcwcxiaobin 创建的主题 程序员 有没有比 whisper large v3 更准更强的
是挺神奇的,有时候 base 也比 large 准
正常啊,以前用手势比“打电话”,都是手比个“六”拇指放耳朵旁,小指放嘴巴旁。现在小孩子们用手势比“打电话”,都是手指并拢手掌直接贴耳朵上。
5 月 28 日
回复了 SteveRogers 创建的主题 Local LLM 本地大模型最佳 Mac 配置选择
30B 左右的这个级别,本地只能干简单的活儿。比如翻译、写个 commit 文档什么的。
qwen3.6 27B 被传的那么邪乎,实际也就是比其他本地模型强一些。别抱太大期望。
俺试过用这个模型写代码,吭哧吭哧写两天,一大堆问题解决不了,换用线上 API ,结果俩小时搞定,架构还更简洁。
5 月 20 日
回复了 tootfsg 创建的主题 Local LLM 关于 5070ti 模型推理的速度和本地部署思考
模型本身就接近 16GB 了,上下文本身就需要占用一部分显存的。-ngl 99 ,不能保证全部加载到 GPU 里,GPU 显存不够,自然会有些层数卸载到内存上。
5 月 20 日
回复了 tootfsg 创建的主题 Local LLM 关于 5070ti 模型推理的速度和本地部署思考
你那个 devstral small2 24b q4_k_m ,肯定爆显存了,部分内容跑在内存里了,所以才这么慢。
一楼的方法可行。俺本地 Claude code ,接的就是自建的 newapi ,模型随便换。
你都用 claude code 了,不用本地模型先看下?别说 7w 了,一个请求十来万都正常。要不那么多人说他们每天用掉 1 亿以上 token 。1 亿 token ,要是在网页上问答,高强度用一个月都用不完。
1 楼已经说了。你那不是“偶然”发现的,那是人家精准触达了你。你想想你做的东西能触达几个人?
哪怕你先做出个小工具,能让 100 个人同时使用呢(注意,不是 100 用户)。
5 月 10 日
回复了 davidyin 创建的主题 Local LLM 想折腾一个 AI 主机,请行家出手
显卡俺在用双卡 2080ti-22GB ,总共 44GB 显存,主机还是 1151 的老平台。可以跑 qwen3.6-27B-Q4KM ,256K 上下文,推理速度大概 20T/s
5 月 7 日
回复了 BeforeTooLate 创建的主题 English 请问现在小朋友是怎么启蒙的英语?
看英文版的动画片。比如 jojo 、wow english 、number block ,岁数大一些的可以看英文的小猪佩奇、汪汪队。
V100 有啥用啊,好多 AI 模型都跑不起来了。
idea 重要个屁,最不值钱的东西了。
V 站不都人均 64G 以上的内存吗?开个浏览器还要省???
能用的模型有哪些?这个在哪里查?
2025 年 12 月 2 日
回复了 zhengfan2016 创建的主题 NAS 有人尝试过使用支持 ups 的户外电源当 nas 的 ups 吗
正儿八经的买个带通信口的 UPS 给 NAS 用不挺好的吗。
三四百就搞定了
绝对的 PCDN
1  2  3  4  5  6  7  8  9  10 ... 18  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   921 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 41ms · UTC 19:08 · PVG 03:08 · LAX 12:08 · JFK 15:08
♥ Do have faith in what you're doing.