首页   注册   登录
 huashengshu 最近的时间轴更新

huashengshu

V2EX 第 87099 号会员,加入于 2014-12-17 14:22:49 +08:00
huashengshu 最近回复了
@SummerWQM 讲道理,spark/hadoop 是需要巨大成本的,1000w 一年的量,一个列式数据库就搞定了
1000w 的短 key 也就 1-2G 吧,key 越多,内存膨胀越厉害,可以考虑分桶+hashmap
如果不需要精确值,可以考虑 HyperLogLog、bitmap,redis 也支持这两种数据结构
9 天前
回复了 kimjxie 创建的主题 酷工作 深圳阿里巴巴 Python 高级开发工程师/专家
后海这边的吧? up↑
10 天前
回复了 miniyao 创建的主题 Python Whoosh 全文检索有分布式的解决方案吗?
都考虑分布式扩展,直接上 es 了,whoosh 索引文件大了以后效率感人
14 天前
回复了 songdg 创建的主题 Python 请教为什么不相等
浮点精度损失
顶,OPPO 是家好公司 :-)
关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2960 人在线   最高记录 3821   ·  
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.1 · 7ms · UTC 04:52 · PVG 12:52 · LAX 20:52 · JFK 23:52
♥ Do have faith in what you're doing.
沪ICP备16043287号-1