V2EX › ShadowPower 的所有回复 › 第 24 页 / 共 81 页

@iorilu 只想双显卡加快训练速度的话，用 huggingface 的 accelerate 库就可以了，官方文档： https://huggingface.co/docs/accelerate/index

不过它只支持数据并行，所以不能解决那种一块显卡显存不够，用多块才够的问题。

之前看过一些框架，据说支持把模型拆分到多块显卡上训练。例如 DeepSpeed 、ColossalAI 之类的。只是我还没成功跑起来……

177 天前

回复了 iorilu 创建的主题 › 程序员 › 怎么感觉 v2 这里很少有 ai 或大模型开发相关得讨论啊

想给大家分享几点：
1. 虽然个人制作一个预训练模型不太现实，但是其实微调模型的门槛很低；
2. 如果你只有 6GB 显存，可以尝试微调 Qwen 1.8B 。虽然不能指望它给你准确回答问题，或者帮你写出正确的代码，但用于只需要想象力的文学创作方面还不错；
3. 零一万物的 Yi 系列模型其实很强，尽管中文互联网上讨论得少。主要优势在中文写作上。虽然它不那么遵循指令，然而 34B-Chat 的中文写作质量真的可以超过 GPT4 ；
4. 除了在 LLaMa 1 刚出来的那个时代，实际上，参数量大的开源模型效果往往不理想。参数量小的开源模型反而更实用；
5. 不要迷信 M2 Ultra 192GB ，想玩出花样，目前看来，NVIDIA 仍然是首选。

说说为什么参数量大的开源模型效果不理想吧。其实最大的原因在于参数量越大，训练成本越高。哪怕对于商业公司来说，预算也不是无限的。训练大模型其实有很多复杂的工程问题，需要多机器的都不简单。

参数量小的模型因为训练成本比较低，很快就能迭代新版本，不断地追加训练数据。
于是，小一点的模型相比大一点的模型，训练得更加充分，数据也更多样。
对商业公司来说，也更适合尝试不同的训练方法。全参数训练 6B 模型最低其实只要一块显卡，60 多 GB 显存。

还有，为什么不要迷信 M2 Ultra 192GB 。
我尝试了市面上绝大多数比较受欢迎的模型（仅中/英文），绝大多数有用的模型都在 1~34B 内。其中又有几乎 95%的模型在 1.5~14B 这个范围内。

M2 Ultra 192GB 的优势则是可以在输出效率能接受的情况下尝试 70B 、120B 、180B （只有一个）的模型。
不过很快你就会发现这些模型一点用都没有：
写作很差，都是那种总-分-总的议论文结构，而且非常机械、死板；
写代码或者回答问题都是错误百出……写代码最好的模型大多数有 34B 左右的参数量；
角色扮演也很无趣，输出实在是太正经了。无论扮演什么，都像在跟售后客服聊天，而且服务范围很有限。最好的角色扮演模型大多数是 13B 左右的参数量。原因很简单，网友自己微调模型，能接受的最高成本在这里。

另外大型语言模型其实可以量化运行，而且性能损失很小。llama.cpp 的 Q5_K_M 量化几乎不影响写作性能，依然能保持和 fp16 同等的质量。只是输出的内容不完全相同。

如果想用 M2 Ultra 192GB 训练模型，其实并不好使。坑很多，有这些：
运行不一定报错，但是训练出来的模型可能是废的。还不好排查问题在哪，网上没人讨论。比如，训练 Stable Diffusion 的 LoRA 拿来用，输出的图都是黑的……
训练速度超级慢。要是模型本身就不大，其实用 NVIDIA 游戏显卡坑少效率还高。模型大到 NVIDIA 游戏显卡跑不起来的情况下，训练速度就相当慢了。你不会愿意把它放着跑个一两年，还保持满载。

PyTorch 的 MPS 后端跑很多模型看起来“能跑”，但是有一些算子实际上没有 MPS 实现，会回退到 CPU 上跑。所以不能光看显卡理论性能。
在训练的时候，ANE 是完全用不上的（推理的时候能用上，但它只能做 INT8/FP16 卷积）。而 NVIDIA 显卡的 Tensor Core 能用上。

个人玩 LLM 最具性价比的选择是 3090 ，进阶选择是两块 3090 ，缺点是噪声比较大，主板和电源要求也高。
4090 在噪声方面好一些，但是现在还是太贵了。

不捡垃圾，不买矿卡，不魔改的情况下，入门选择是 4060Ti 16GB 。
只想体验一下的话，租个 VPS 玩玩，或者用 llama.cpp 用 cpu 跑……

177 天前

回复了 iorilu 创建的主题 › 程序员 › 怎么感觉 v2 这里很少有 ai 或大模型开发相关得讨论啊

最近微调了 Yi-6B ，能用来写知乎回答，能过知乎的 AI 检测……
虽然没什么用，但是好玩。比给 GPT 写各种各样的 Prompt 好玩多了。

目前还有不少问题，回答里会有很多广告、引流的内容。

这是一些例子：
https://i.imgur.com/2EsBuG9.png
https://i.imgur.com/mrJHfON.png

179 天前

回复了 keepRun 创建的主题 › 小米 › 都过来瞧瞧，我碰到的应该是小米应用商店的 bug 而不是类似拼多多植入后门这种问题吧

Note12Turbo 14.0.25 ，刚试了一下，没有复现
应该是 bug

179 天前

回复了 raw0xff 创建的主题 › Apple › 求推荐可与 macbook air m2 媲美的 x86 笔记本

@neiltroyer849 要续航也有选择：
AMD 6800H / 7840HS
Core Ultra 系列（刚出的）

我的小新 Pro14 （ 7840HS ）可以做到最高屏幕亮度写代码，同时后台跑浏览器+QQ+微信+各种小工具+笔记软件，真实续航 8 小时。网上看评测比较垃圾，后来我发现这电脑键盘背光的功耗堪比屏幕……
关掉键盘背光，续航从 6 小时多提升到 8 小时多。

比起 11 代之前的酷睿，已经是“显著提高”了。
当然，要想有 Apple Silicon 水平，那得等高通台积电工艺的 ARM 处理器。

179 天前

回复了 spitfireuptown 创建的主题 › 程序员 › 搞开源项目，收费卖文档有搞头吗

这种商业模式能做，就是上手门槛太高的话，一开始不会有用户……
吸引用户使用的门槛应该尽可能低。

等用户有了更高级的需求之后，想到自己已经用了很久，改用其他项目成本还要更高，才会乐意在现有的项目上付费。

179 天前

回复了 fdghjk 创建的主题 › 程序员 › 如何让 Windows 开机之后同时登录两个或者三个用户？

可以变通一下：
如果用户没有密码，可以先自动登录一个用户，然后通过 runas 命令以其他用户身份运行程序（这个命令不允许自动输入密码）
如果有密码，则用另一台电脑向这台电脑分别发起远程桌面连接……

179 天前

回复了 sampeng 创建的主题 › 程序员 › 一个疑问，现在是人均一台开发机了？

我在小公司，没有远程开发环境。
电脑的话，公司给 5000 ，自己去买，用三年归个人……

179 天前

回复了 Haku 创建的主题 › Python › 请问下 Java 如何调用含有第三方依赖的 Python 项目

如果 Python 和 Java 都在同一台机器上
用命名管道来传数据就好了

179 天前

回复了 raw0xff 创建的主题 › Apple › 求推荐可与 macbook air m2 媲美的 x86 笔记本

看到不少人说没有
我感觉颜值比 MBA M2 好的笔记本不少啊。现在的 MBA 模具已经没有上一代那么好看了，而且还有刘海屏……

若是拿 MacBook 最长的长板去跟其他产品比，那么确实在任何时候都会得出“没有”的结论，毕竟什么时候都能找到至少一项优势。
除非 MacBook 跟其他笔记本比真的没有任何优势了。

179 天前

回复了 Aaron01 创建的主题 › iPhone › 从小米转过来，觉得 iPhone 的电话、通讯录、拨号这些好难用啊

@klo424 我也有小米 6 ，那玩意拍照效果和拍照体验确实不行。不过其实当时的情况是这样：
1. 设计小米 6 的时候，小米公司还没有专门的影像部门。到小米 8 的时候就有了
2. 那时候拍照还在追求“把夜晚拍成白天”，再加上 DXO 测的那些项目。而拍照的体验则不在考虑范围内

其实到小米 10 的拍照体验都不是很好，拍的时候要做一大堆计算，转圈转一会才能成像。部分非小米手机今天仍然是这种体验……

小米 12s 以后的手机拍照体验都特别好了。

179 天前

回复了 yougo 创建的主题 › Apple › 有没有好用的私人音乐播放器

我很久以前有一个想法，歌曲都保存在手机里，因为出门都会随身带着，随时都可以听。
配套一个电脑版，手机版连接电脑之后，会一直后台运行作为音乐服务器，在电脑上播放存储在手机里的歌曲。

不知道有多少人能接受这样的设计。

179 天前

回复了 raw0xff 创建的主题 › Apple › 求推荐可与 macbook air m2 媲美的 x86 笔记本

联想 yoga air 14s 2023
华硕灵耀 14 2024

180 天前

回复了 shayang888 创建的主题 › 游戏 › 手游这东西到底还要不要继续玩下去

原神这游戏有个特点：
充得越多，游戏体验越差。一分都不充，游戏体验最好。
当然，如果赚钱实在太容易，那么可以随便充钱，以下结论不适用于充钱丝毫不影响游戏体验的玩家。

还能更好吗：
不做每日，不刷 9~12 层，看心情刷圣遗物，一旦不想刷一定不刷。

为什么：
在你没有充钱的时候，抽到哪个角色都感觉很开心，因为都觉得赚了。
当你充了钱，就会对收益产生预期。你会想“我花了这么多钱应该要得到些什么吧”。这时候哪怕抽到了角色或者武器，你都会觉得它是“理所当然”的事情，而不是“意外惊喜”。
而当你充了钱却没有抽到想要的东西时，反而感觉“亏大了”。钱是真的花了，获得了一堆没有用的垃圾……

虽然你充钱得到的东西更多，然而心态已经变了，体验反而更差了。

武器没必要抽，因为不会带来任何游戏乐趣，成本却比抽角色还要高。

除去上面的，剩下的内容反而才是游戏里有意思的东西。原神里性价比最高的东西其实是活动，真正有必要做的只有这个。

题外话：我有一个朋友平时还给原神写一些攻略，玩原神反而还赚钱，米哈游给的二创激励。。。

180 天前

回复了 huage 创建的主题 › NVIDIA › 2023 年 12 月底了哪款显卡合适个人电脑做 AI 图文？

@mumbler 那得先把模型转成 openvino 的模型。其实坑挺多的，一年前我就在干这个……

1 ... 20 21 22 23 24 25 26 27 28 29 ... 81

❮

❯