V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  isSamle  ›  全部回复第 1 页 / 共 14 页
回复总数  271
1  2  3  4  5  6  7  8  9  10 ... 14  
@tongqe 你买个 1H1G 的服务器,包年可能才 100 以内,自带了公网 IP 啊
1.搞个 IP 代理池 2.降低采集频率,那你不说谁知道,有些事情是可以做不可以说的
自己家里放一个台式电脑,装 ubuntu 系统,随便找个带宽好点的轻量套餐穿透出来
5 天前
回复了 Jinnrry 创建的主题 程序员 Google Gemma 开源没人讨论下吗?
我觉得现在的大模型都是畸形的,应该训练响应模式而不应该训练响应内容。
听起来像面向监狱编程,爬虫+脚本+小软件=方便使用的数据采集工具?
1.python 的爬虫无非就是 requests 、urllib 之类的库,选一到两个库了解下即可
2.了解下 http 之类的网络协议
3.找一些简单的网站,如天气、黄页之类的实操一下
4.对网络请求有一定了解后,优化下技能:正则表达式学习下(或者找些好用的工具能够自动解析页面数据生成正则的)、多线程多进程的库了解下、常见反爬机制手段了解下( IP 池、selenium )、最重要的是,相关刑法了解下
5.以上都 OK 的话,就可以尝试把这种采集工作打包成脚本工具了,Tkinter 之类的库了解下(这个可以问 GPT 让他给你出了你再修改也可以)
6.进阶版本的话,涉及到采集数据的存储和处理,那就建议搞个后台系统,这个时候 Django 再了解下,Excel 导出相关的库了解下
7.数据想要展示出对应的效果,画图库 pyecharts 之类的了解下
8.要更方便一点,类似于钉钉机器人了解下,官方文档一般都有
8848
61 天前
回复了 superliwei 创建的主题 分享创造 国产软件征集中文名字
观才板
惠州吧,就是有些店早上 10 点都不开门,晚上一大早就关门了……没直接关门也直接把门关上出去吃饭几个钟不回来😂
应该是项目做了限制吧,项目里面故意加锁避免高频用量?还没看源码随机猜的。
为什么不用 mysql
83 天前
回复了 isSamle 创建的主题 分享创造 翻译大模型出来了还需要苦学语言吗
@yyxingkong 没有,主要是方便,用 gpt 的话我也试了,Whisper 识别,gpt 翻译,再文本转语音,设备性能不行太慢了
86 天前
回复了 isSamle 创建的主题 分享创造 翻译大模型出来了还需要苦学语言吗
@Masoud2023 这叫开诚布公
86 天前
回复了 isSamle 创建的主题 分享创造 翻译大模型出来了还需要苦学语言吗
@wwk 主要还是没有语言天赋,初中到大学毕业,英语没及格过
86 天前
回复了 isSamle 创建的主题 分享创造 翻译大模型出来了还需要苦学语言吗
@sakura6264 等脑机接口了是吧
86 天前
回复了 isSamle 创建的主题 分享创造 翻译大模型出来了还需要苦学语言吗
@threeEggs123 前几天写的,现在好像模型有 V2 了,对本地处理,不用调用 meta 的接口,自己下了模型部署在本地就行
86 天前
回复了 zjt666666zjt 创建的主题 程序员 大二学生求教
我也是学应用统计学的😂当年没你这个觉悟,毕业后才自学转撸代码的。

建议就是,有研究学习能力的话,在精不在多,研究学习能力比较弱的话,那就玩多点花样。

有条件的话,深入学习下人工智能/机器学习,未来几年的风口吧,而且本质上和概率论数理统计/计量经济学之类的专业课有一定的相关相似性。
1  2  3  4  5  6  7  8  9  10 ... 14  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   914 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 21:20 · PVG 05:20 · LAX 13:20 · JFK 16:20
Developed with CodeLauncher
♥ Do have faith in what you're doing.