V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  suuuch  ›  全部回复第 5 页 / 共 16 页
回复总数  312
1  2  3  4  5  6  7  8  9  10 ... 16  
249 天前
回复了 haoyu7 创建的主题 程序员 有一台服务器一般都做什么
frp, 梯子, 数据库,爬虫, streamlit page , openai 转发, slack 机器人, 小飞机机器人

大概就这些。。。
不要玩文字游戏。。就国内这几代人可以说是安分守己、遵守各种道德、法律、号召的代表了,结果依旧要为生计奔波。。反而是不遵守的人更有机会。你觉得是啥原因?
主要是户口不在上海,然后想在上海交。貌似小微企业注册和存续一年花不了多少钱?
注册小微企业,自己给自己交,有人现身说法没?
大概几种情况
1. 确实工作太忙
2. 招聘刚放出来,岗位不着急,手上没有更好的,你也有一些缺点,想等等看有没有更好的
3. 招聘刚放出来,岗位不着急,手上有其它候选人,你也有一些缺点,想等其它候选人多面两次再对比决定
4. 招聘刚放出来,岗位可招可不招,想捡漏一个比较厉害的
colab pro 可以先充值一个月试试看,只做推理的话,还是够用的,还可以免得冲动消费。。
我也发表下个人的看法:
在某种意义上来说,各种技术方案、编程语言,都是在应对人。计算机本身并不关心这些二进制的是什么,换言之任何技术方案、编程语言、术语、岗位都是在解决人的问题。

纯粹从技术上去考虑这些,确实是没什么区别的,每种方案都可以完成目标。区别在于这些方案对应的其它成本,比如机器成本,人力成本,时间成本这些显性成本。还有一些隐性成本,比如沟通成本之类的。

数据仓库这些东西,确实就是 收集数据 -> 整理数据 -> 输出数据,这个链路。更抽象点的就是数据的输入和输出。
抽象到这里的时候,所有的程序、系统都可以抽象的理解为 数据的输入和输出。



至于提到的其它问题:

“什么是数据库,什么是数据仓库”:数据库是对应软件系统,数据仓库是一种概念上的,并不对应到具体软件上。

“数据仓库有什么优势”:数据仓库的优势取决于对比系统,业务系统要求高并发,数据仓库要求高吞吐量。

“ELT 和 ETL 的区别”:这两者的区别在于数据处理数据速度和数据传输速度之间的关系,决定采用哪种方案看场景。


“数据治理的好处”:数据治理也是特定场景下的,互联网里面确实不多。传统企业里面多,有些传统企业里面的系统有 dephi ,c#,java 诸多版本,整个建设周期可能比程序员的生命周期都长,各种奇奇怪怪的数据和定义,这种背景下数据治理的好处才能被切身体会出来。
258 天前
回复了 FerrisChan 创建的主题 职场话题 转安卓 还是继续 pc 开发
试试转游戏呢?
270 天前
回复了 wt0210 创建的主题 NVIDIA 现在买 4090 是个好时机吗
@L13 前段时间收到推送的,我刚搜了下,发现找不到了。。。
270 天前
回复了 wt0210 创建的主题 NVIDIA 现在买 4090 是个好时机吗
1. 玩游戏得话,4060ti 差不多大部分游戏可玩。

2. 跑模型得话,B 站上有人买三张 4060ti 跑模型,看参数性能是大于 4090 的。。折衷下,买两张 4060ti 看看行不行。
273 天前
回复了 Hole 创建的主题 职场话题 怎么从领导的角度看问题?
一般情况下,我的领导在休假期间找我的原因只有一个,更大的老板在找他,他需要我解释一些细节的东西。
在事业单位这种,对财务和流程相关的事情都是优先级特别特别高的,要慎之又慎,这个很容易让人抓住小辫子,这个事情说大了可以往捅到上级部门,小了说内部审计找麻烦都可以。
原因非常简单:未按流程走账目,私企很容易过,国企可不行,一定要去找更上一级报备一下才可以。。
我们这审计曾因为项目提前结束把我们领导拉过去谈话。。


原始帖子我也看了,但是给的信息太少了。。。像有些领导可能一两年之间,就一次或者两次这种在休假期间找你的情况,我不会认为领导有什么问题。。假如是频繁的小题大做,休假或放假各种要求工作的频率比较高,才能说明这个领导有问题。。
278 天前
回复了 thawne 创建的主题 NAS NAS 求推荐
群晖吧,买之前觉得贵,买之后觉得挺好用的。

要高性能的话,就自己再组个台式机跑其它的。
@FlyingBackscratc 安装 hive 的前置条件是安装好 hdfs ,据我所知是没办法直接 docker 部署的。
hadoop 是个计算框架,里面东西很多,一般都是集群安装。
里面最主要包含 MapReduce 和 HDFS 。
HDFS 是分布式文件系统,MR 是计算框架。
HIVE 是一个类 SQL 的查询引擎,查询 HDFS 里面的数据。底层计算引擎默认是 MR 的,可以改成 tez ,spark 之类的计算引擎。
SPRARK 是计算引擎,用的 RDD 概念实现的。


性能的话,粗暴点估算,3 台 CPU *2 , 内存 128G *2 的服务器,算是起始配置。低于这个配置,找列存储数据库做 OLAP 系统即可。比如 clickhouse ,greenplum 之类的,数据同步 直接 kettle 就行。
还有其它一些基于 PostgreSQL 的数据库,在 OLAP 领域都不错。

没必要纠结。。上了 hadoop 涉及的到程序本身的性能和运维人员的能力要求都会高很多,并不是那么容易直接上去的。
@ironboxplus 这个方案我试过,网络延迟是挑战。我用的 talscale 没成功,能看到机器,但是无法联通。我就继续使用我之前用的 zerotier 了
293 天前
回复了 xiaomayi000 创建的主题 NAS N100 还是 NUC9?
外置硬盘,你们是怎么挂的?
1  2  3  4  5  6  7  8  9  10 ... 16  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2674 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 34ms · UTC 11:34 · PVG 19:34 · LAX 03:34 · JFK 06:34
Developed with CodeLauncher
♥ Do have faith in what you're doing.