V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  flyaway  ›  全部回复第 1 页 / 共 13 页
回复总数  247
1  2  3  4  5  6  7  8  9  10 ... 13  
BTW, 我觉得 8 楼说的是正解。
@MajestySolor 人类的语言是线性的(读和写都是一个一个顺序进行的,不然人脑无法理解。)。 在 ML 领域,此类问题都称为 sequence modeling 问题,也是 NLP 中最常见的建模方式。
ChatGPT 确实是一个一个 token 生成的,但是 OpenAI 可以:
1. 每次 request 都等 ChatGPT 完成输出之后,一次性把一段话发给你
2. 每次 request 都等 ChatGPT 完成输出之后,一个词一个词的发给你,模拟人的说话方式
3. 每次 request 都是实时输出,但是模型很大,也许生成速度就是这样,不得不一个词一个词蹦。 虽然现在计算力很大,但是模型也很大啊……
2022-10-08 10:07:28 +08:00
回复了 JYLu 创建的主题 程序员 如何高效地调试 py 程序?
beancount +1
2022-08-18 04:00:57 +08:00
回复了 Richard14 创建的主题 问与答 v2er 有熟悉健身的吗?这几年感觉身体越来越糟糕
取决于你的健身目标,如果想要 fit 和 good shape, 那就专注无氧,力量训练。如果仅仅是希望提高心肺能力,纯有氧运动应该是足够的了。我长期坚持过三项有氧项目: 跑步、游泳和室内单车。我最喜欢的是游泳,可惜有场地限制。跑步可能会伤膝盖,之前被诊断是 over-use 了。现在主要是坚持室内单车,每次一个小时,心率维持在 150 左右。

如果体重基数比较大,先从低强度的有氧开始,慢慢加长运动时间和强度。最好搞个手环监控一下心率。
2022-06-24 02:00:35 +08:00
回复了 Richard14 创建的主题 Python 在 Pytorch 学习的过程中如何借助预训练模型帮助理解结构?
Transformer 可以看 huggingface ,它有很多 tutorial ,适合入门。
https://huggingface.co/docs/transformers/index 大量的模型和数据,足够你玩很久了……
2022-02-26 01:07:04 +08:00
回复了 wangyifan 创建的主题 奇思妙想 请问有这么一款记账软件吗?主要用于年度汇算
Beancount + 1
2022-01-27 23:31:08 +08:00
回复了 l1ve 创建的主题 生活 年近三十,各位 V 友有健康焦虑了吗
年过三十,刚做体检,血糖正常,血压正常,胆固醇指标略微踩线……
2021-12-09 04:45:23 +08:00
回复了 luckycat 创建的主题 生活 海外定居要如何处理父母养老问题?
@renothing 老实说,我就是这么想的,将来我自己去住养老院……我觉得住养老院挺好的,和同龄人一起有共同话题,可以一起追忆往昔。现在社会发展那么快,和下一辈人一起生活反而会有更多的摩擦。而且,我觉得一代人有一代人的生活,没必要被上一辈绑定。当然,这也只是我现在的想法,也许将来会变。
我知道我的想法很多老人是无法接受的,我也接受他们无法接受的事实。所以,我会努力朝着和他们在一个城市一起生活的方向努力。但,对于我的下一代,我不会有同样的期待。我倒是希望他们有多远就走多远,去体验他们自己的生活……
2021-11-16 05:01:00 +08:00
回复了 zxCoder 创建的主题 问与答 pytorch 神经网络问题请教
1 楼+1 没参与到 computation graph 不应该有影响
2021-10-12 23:40:31 +08:00
回复了 wszgrcy 创建的主题 机器学习 说下我对神经网络的认知不知道说的对不对求大佬来评价
- 并不是什么排在前几位的才研究优化,只是大家的研究领域不同而已。有的人研究模型结构,比如现在流行的 Transformer,也有人研究优化算法,比如 Adam 和 Adafactor 。分工和兴趣不同而已。
- 我没见过那么复杂的计算,我猜测是因为简单的加和计算可以转化为矩阵乘积,更加适合用 GPU 来加速。
- 个人不推荐 Matlab,Matlab 更加偏数学和工程。如果你确实想做一些东西,我建议还是从 python 开始,python 圈里的资源更加丰富。
2021-10-12 23:22:06 +08:00
回复了 wszgrcy 创建的主题 机器学习 说下我对神经网络的认知不知道说的对不对求大佬来评价
- 反向传播算法确实是基础,但是除非是做优化的或者做教学的,一般从业者其实很少手工推导。因为大部分的神经网络框架都已经处理好这部分内容了。实现机制比较复杂,我只知道会在内存中维持一个 compution graph 用来追踪所有的网络连接和神经元。
- 层与层之间的连接可以是非线性的,实际上大部分的激活函数都是非线性的。
- matlab 是一种编程语言,tensorflow, pytorch 是 python 下的神经网络框架。tensorflow 和 pytorch 数学抽象都是一样的,只是具体的实现方式不一样。就像 java 和 C++的关系,都是基于上下文无关文法的语言,只是各自有各自的特点。
一般都是要放源码的吧,投会议的时候会有一个检查项,就是看有没有公开源码,能不能复现结果。
2020-08-27 23:57:49 +08:00
回复了 wode82863790 创建的主题 App Store 请大家推荐一下自己用的记账软件
beancount +1
2020-08-13 03:48:49 +08:00
回复了 dtgxx 创建的主题 问与答 大家觉得,勤能补拙吗?
前几年比较流行一句话: 努力决定了成就的下限,天赋决定了成就的上限,但大部分人的努力程度还不足以比拼天赋。
1  2  3  4  5  6  7  8  9  10 ... 13  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2768 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 72ms · UTC 12:01 · PVG 20:01 · LAX 05:01 · JFK 08:01
Developed with CodeLauncher
♥ Do have faith in what you're doing.