V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
eliyah
V2EX  ›  编程

大型社交网站(如新浪)一个博主有几百万粉丝都查得出 ID,数据是如何储存的呢?

  •  1
     
  •   eliyah · 2020-11-21 16:58:24 +08:00 · 2103 次点击
    这是一个创建于 1470 天前的主题,其中的信息可能已经有所发展或是发生改变。
    假设 ID 是 int32,有一个 1024 万粉的博主,1024*10000*4B = 39GB.
    实际情况是怎么实现的呢?

    另外一种情况是用户表中保留了关注的人的 ID 的枚举,但是粉丝数这个值只是一个整数字段.但这样同时会造成另外一种问题,即我在获取这位博主的所有粉丝时(实现中参照何同学 600W 粉视频),会检索整个用户数据库来配对,这个工作量时巨大的,同样不合理.

    纯小白,偶然想到这个问题,希望有大佬能解惑
    第 1 条附言  ·  2020-11-26 13:06:17 +08:00
    哈哈哈,39MB
    4 条回复    2020-11-21 20:52:04 +08:00
    putaozhenhaochi
        1
    putaozhenhaochi  
       2020-11-21 17:58:47 +08:00 via Android
    1024*10000*4B = 39GB.???
    julyclyde
        2
    julyclyde  
       2020-11-21 19:31:43 +08:00
    现在已经禁止拉别人的“所有”粉丝了。所以这个问题也就解决了
    delectate
        3
    delectate  
       2020-11-21 20:20:57 +08:00
    看实际粉丝是个小众需求,只要缓存几百个就足够了;没有命中再去检索不迟;
    所以实际上是维护三个表:粉丝数字;假粉丝(少更新);真粉丝(实际粉丝)
    其中,粉丝数字 和 真粉丝 count 是一致的。
    love
        4
    love  
       2020-11-21 20:52:04 +08:00
    唉编程还是要先从基本知识学起,你这问题问得好可笑
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   920 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 21:44 · PVG 05:44 · LAX 13:44 · JFK 16:44
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.