V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
lianxiaoyi
V2EX  ›  问与答

mysql group 优化

  •  
  •   lianxiaoyi · 2017-03-09 14:30:54 +08:00 · 2281 次点击
    这是一个创建于 2823 天前的主题,其中的信息可能已经有所发展或是发生改变。

    表结构

    img

    表中大概有 500 多万条数据,表每天在以 11 万条数据增长

    现在执行 sql

    	SELECT COUNT(*) AS `num`, `trail` FROM (
        		SELECT `device`, `trail` FROM `ts_devices_count`
            		WHERE (`created_at` >= '2017-02-07') AND (`created_at` <= '2017-02-14') 
    			GROUP BY `device`
            ) `temp` GROUP BY `trail`
    

    在子查询中的表存在索引,子查询返回的结果表 temp 大概 11 万条数据,

    整个 sql 执行下来大概需要 10 秒钟左右执行完,

    如果单独执行子查询中 sql

    	SELECT `device`, `trail` FROM `ts_devices_count` 
        		WHERE (`created_at` >= '2017-02-07') AND (`created_at` <= '2017-02-14') 
            	GROUP BY `device` limit 200 offset 27384;
    

    耗时大概是 1.39 秒

    有没有办法能够优化到 1 秒内???或者换别的某种数据库能加快????

    7 条回复    2017-03-09 19:45:38 +08:00
    ebony0319
        1
    ebony0319  
       2017-03-09 14:52:03 +08:00   ❤️ 1
    '''
    SELECT `device`, `trail` FROM `ts_devices_count`
    WHERE (`created_at` >= '2017-02-07') AND (`created_at` <= '2017-02-14')
    GROUP BY `device`
    '''
    先说这一段有什么意义哇,我刚试了一下跟
    SELECT `device`, `trail` FROM `ts_devices_count`
    WHERE (`created_at` >= '2017-02-07') AND (`created_at` <= '2017-02-14')
    执行结果一样的哇。
    lianxiaoyi
        2
    lianxiaoyi  
    OP
       2017-03-09 14:54:39 +08:00
    @ebony0319 排重 device,device 会存在重复情况
    ebony0319
        3
    ebony0319  
       2017-03-09 15:27:56 +08:00   ❤️ 1
    @lianxiaoyi 应该用 distinct 把。
    liprais
        4
    liprais  
       2017-03-09 16:24:39 +08:00   ❤️ 1
    为啥不每天计算下然后加起来呢?
    liprais
        5
    liprais  
       2017-03-09 16:25:29 +08:00   ❤️ 1
    @liprais 如果是按天新增的话历史数据不需要每次查询的时候都算啊,算一次存起来就好了
    zeraba
        6
    zeraba  
       2017-03-09 19:08:45 +08:00 via Android   ❤️ 1
    SELECT COUNT(*) AS `num`, `trail` FROM ts_devices_count ts inner join (
    SELECT distinct `device` FROM `ts_devices_count` WHERE `created_at` between '2017-02-07' and '2017-02-14')
    ) `temp` on temp.device = ts.devive
    group by 2
    试试?
    大概是表自连接去重 或者使用 having count 也行
    abc123ccc
        7
    abc123ccc  
       2017-03-09 19:45:38 +08:00   ❤️ 1
    explain SELECT `device`, `trail` FROM `ts_devices_count`
    WHERE (`created_at` >= '2017-02-07') AND (`created_at` <= '2017-02-14')
    GROUP BY `device` limit 200 offset 27384 ;

    explain SELECT distinct `device`, `trail` FROM `ts_devices_count`
    WHERE (`created_at` between '2017-02-07' AND '2017-02-14')
    limit 200 offset 27384 ;

    看看走没走索引
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1763 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 16:33 · PVG 00:33 · LAX 08:33 · JFK 11:33
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.