1
zrj766 2016-03-08 09:18:24 +08:00 via Android 1
piwik
|
2
deben OP @zrj766 piwik 如果是多用户多站点支持, 貌似 piwik 改起来有点儿工作量, 不过看看 piwik 的源码来学习的确是非常好的思路.
|
3
jugelizi 2016-03-08 09:45:04 +08:00 1
自己做广告平台吗
piwik 还是不错的 随便改过一点 你还需要 Hadoop |
4
deben OP @jugelizi 请问, 千万 PV, 就需要 Hadoop 了吗? 我的想法比较简单, 用 Nginx 分发到几个服务器能解决问题吗? 另外, 这个级别的数据存储用 MySQL 就不行了吧, 需要上 noSQL 的数据库了吧?
|
5
lecher 2016-03-08 11:02:49 +08:00 via Android 1
日千万 PV ,第一个问题在写入量上面,但是算下来就是峰值一秒顶多就是一千的日志, MySQL 绝对可以扛得住,至于接收日志的 Web 处理如果单台的性能不行,分几台服务器可以扛得住。用 NoSQL 撑写入量在数据管理上更容易做分布式。
其次是分析计算,这个重计算的事情,看业务有多复杂了,如果计算模型很复杂用 spark 、 Hadoop 这类的计算框架来节省开发成本也不错。如果不是很复杂就是简单的统计汇总可以不用那么重型的计算框架,自己写。 |