V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
anonymoustian
V2EX  ›  程序员

百度指数、微信指数、微博指数等等这样的系统后端是如何存储数据的?

  •  
  •   anonymoustian · 2018-02-01 20:42:24 +08:00 · 2240 次点击
    这是一个创建于 2247 天前的主题,其中的信息可能已经有所发展或是发生改变。

    用过百度指数、微信指数朋友们应该都了解,输入一个关键词或者热词,它就会返回这个词在过去的一段时间的流量情况。

    我想实现类似的一个系统,但是不知道从何入手。 现在的问题就是不清楚这种系统后台是用什么数据库存的,因为每天都有“新词”产生,而且要一直记录每天或者每小时的每个词的 count,数据会越来越多。

    所以想请教一下朋友们,有实现过类似功能的老铁能指导下 数据库应该选用什么方案,表和库结构或者一些字段该如何设计吗?

    谢谢了!

    4 条回复    2018-02-02 17:19:05 +08:00
    anonymoustian
        1
    anonymoustian  
    OP
       2018-02-01 20:46:21 +08:00
    对于新词,它之前时间的数据肯定是空的; 而且这些词的量级大概在 2 亿左右,老铁们有什么建议吗?
    willchen
        2
    willchen  
       2018-02-01 20:47:47 +08:00
    试试时序型数据库吧
    anonymoustian
        3
    anonymoustian  
    OP
       2018-02-01 20:50:38 +08:00
    @willchen 你好 我尝试过时序型数据库 influxdb,如果有两亿个词的话,就要有 两亿种 series, 这个真的没问题吗?或者您有用过什么好用的数据库?
    anonymoustian
        4
    anonymoustian  
    OP
       2018-02-02 17:19:05 +08:00
    这么多人收藏。。。没人回答一个么。。。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3224 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 36ms · UTC 10:52 · PVG 18:52 · LAX 03:52 · JFK 06:52
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.