yangxin0

yangxin0

V2EX 第 35131 号会员,加入于 2013-03-03 15:25:18 +08:00
根据 yangxin0 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
yangxin0 最近回复了
11 天前
回复了 Guidoo 创建的主题 分享发现 记账后发现每个月的花费有点多
在一线城市花 10k 是非常轻松的,除非天天吃🥬
13 天前
回复了 chenqh 创建的主题 Python 关于 moviepy 裁剪视频的速度问题
要看你调用硬件 codec 没,默认大概率是 CPU 调用,速度差异非常巨大。
19 天前
回复了 anson264556364 创建的主题 问与答 电子书翻译
有道翻译,付钱等收货就好了。
分治:
1 、用空间换时间(计算)
2 、用时间(计算)换空间

针对( 1 )有 spark 集群很快的,如果预算有限那么方法( 2 ):
1 、把数据分成 N 块,并针对 N 块内进行去重
2 、从 n 块中取一块,和剩下的 n-1 块去重,取这一块建立 hash or map 都可以,n-1 按照顺序读取
3 、从剩下的 n-1 块中又进行步骤( 2 ), 直到 n=0
4 、经过上述思路处理的 csv 就包含重复
我的 iPhone 贷款了 2 年,终于要还完了,抢首发其实真不好,等几个月真香。
Save As PDF and Annotate
最开心的还是刚毕业的时候,拿到工资吃吃喝喝
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3470 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 04:26 · PVG 12:26 · LAX 21:26 · JFK 00:26
Developed with CodeLauncher
♥ Do have faith in what you're doing.