V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
oldcai
V2EX  ›  服务器

请问什么监控可以反映服务器一天内哪个/组进程占用 CPU/磁盘/内存等资源最多

  •  
  •   oldcai · 2017-07-10 11:07:48 +08:00 · 3315 次点击
    这是一个创建于 2474 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我所知道的精细到每个进程的监控都仅仅反映实时情况;

    而可以看到历史数据的都只有综合的图表,没有细分到进程、用户的,比如整个机器的 CPU/内存 /磁盘读写使用情况。

    所以想请教一下,想可回溯地统计精细到进程、用户等的信息怎么做到。

    9 条回复    2017-07-12 11:04:41 +08:00
    hadoop
        1
    hadoop  
       2017-07-10 11:09:36 +08:00 via Android   ❤️ 1
    进程级流量监控没看到比较好的
    jigloo
        2
    jigloo  
       2017-07-10 11:16:18 +08:00 via Android   ❤️ 1
    我用 Prometheus 和 granfana 做过,自己写 exporter 而已,不难。

    cpu 内存磁盘最容易。其中 tcp 流量监控复杂一些,要用内核的新一些的特性才比较容易做。
    jigloo
        3
    jigloo  
       2017-07-10 11:18:23 +08:00 via Android
    哦,忘了说,据我所知,市面上没有现成开源的,所以我才自己弄的。
    hadoop
        4
    hadoop  
       2017-07-10 12:39:42 +08:00 via Android
    @jigloo tcp 流量监控能到进程级别吗
    jigloo
        5
    jigloo  
       2017-07-10 13:17:48 +08:00   ❤️ 1
    @hadoop 嗯,用的是 tcp_info 这个结构,原理和 netflix tcptop 差不多。不是非常准确,但是够用了。
    jigloo
        6
    jigloo  
       2017-07-10 13:25:51 +08:00
    也许我那天可以问上面,是否可以把这个 exporter 开源,也算解决痛点填补空白了。
    jigloo
        7
    jigloo  
       2017-07-10 13:39:00 +08:00   ❤️ 1
    哦,还有变通的一招。

    把进程容器化,然后用 cadvisor。(这货非常吃 CPU 慎用)
    rswl
        8
    rswl  
       2017-07-10 14:34:48 +08:00   ❤️ 1
    grafana + influxdb + telegraf
    QQ2171775959
        9
    QQ2171775959  
       2017-07-12 11:04:41 +08:00
    专业的工具还是有蛮多的嘛。。。老兄多去试一下。。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1083 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 22:52 · PVG 06:52 · LAX 15:52 · JFK 18:52
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.