V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
javazero
7.59D
0.5D
V2EX  ›  云计算

有 50+服务器要管理,有没有什么软件可以监控服务器

  •  
  •   javazero · 2025 年 3 月 14 日 · 3775 次点击
    这是一个创建于 307 天前的主题,其中的信息可能已经有所发展或是发生改变。

    要求:不在服务器安装软件(别到处拉屎),理论上用 ssh 就可以监控硬盘网络状态等等 实时监控占用等等

    29 条回复    2025-03-18 17:42:58 +08:00
    defunct9
        1
    defunct9  
       2025 年 3 月 14 日
    prometheus grafana alertmanager 大全套
    javazero
        2
    javazero  
    OP
       2025 年 3 月 14 日
    @defunct9 这个感觉有点重了
    max1024
        3
    max1024  
       2025 年 3 月 14 日
    弄一个服务器,自己写个定时任务,实时向上面推数据?
    lynan
        4
    lynan  
       2025 年 3 月 14 日
    Server Cat
    iloveayu
        5
    iloveayu  
       2025 年 3 月 14 日
    @javazero 啊?这还重吗,需要无 agent 的监控那 HertzBeat 吧,作者也上 V 站。
    tool3d
        6
    tool3d  
       2025 年 3 月 14 日
    最简单就是让 gpt 写一个脚本,50 个服务器依次网络轮询。

    不过我个人还是偏向于安装监控软件,一是可以记录历史硬件温度之类的信息,出问题可以复盘。二是有故障可以自动发邮件报警,不需要你去挨个查询。
    muzihuaner
        7
    muzihuaner  
       2025 年 3 月 14 日 via Android
    哪吒面板
    muzihuaner
        8
    muzihuaner  
       2025 年 3 月 14 日 via Android
    nezha.wiki
    javazero
        9
    javazero  
    OP
       2025 年 3 月 14 日
    @tool3d 出问题这些有 bmc 可以记录。所以我就是只想要一个面板,每个服务器显示几个数字就行了。有点类似 netdata 这种感觉的东西
    javazero
        10
    javazero  
    OP
       2025 年 3 月 14 日
    @muzihuaner #8 nb 这个好漂亮
    MimicOctopus
        11
    MimicOctopus  
       2025 年 3 月 14 日 via Android
    推荐 beszel ,有几个环境在用
    lower
        12
    lower  
       2025 年 3 月 14 日
    liuliuliuliu
        13
    liuliuliuliu  
    PRO
       2025 年 3 月 14 日
    @muzihuaner #8 这个也需要安装软件吧
    javazero
        14
    javazero  
    OP
       2025 年 3 月 14 日
    搜了一圈,好像都要在服务器装一个 agent 。可能确实只能自己写脚本了
    ghwolf007
        15
    ghwolf007  
       2025 年 3 月 14 日
    前面加个跳板机?
    twoz
        16
    twoz  
       2025 年 3 月 14 日
    之前需求有点类似,发现这类监控都要在监控端装个 watchdog ,后来也只能大全套了。
    gvdlmjwje
        17
    gvdlmjwje  
       2025 年 3 月 14 日
    我看到你说 BMC ,你们用联想服务器的话可以试下 LXCA ,统揽硬件的。OS 层的告警看不了。
    javazero
        18
    javazero  
    OP
       2025 年 3 月 14 日
    @iloveayu 这个好,我试试
    lance07
        19
    lance07  
       2025 年 3 月 14 日
    这个让 gpt 写一个应该很方便,之前跑模型写过一个,ssh 上去执行命令返回就行
    wenber
        20
    wenber  
       2025 年 3 月 15 日   ❤️ 1
    考虑付费的话那肯定就是 ServerCat ,开源就是: https://github.com/xpipe-io/xpipe
    javazero
        21
    javazero  
    OP
       2025 年 3 月 15 日
    @wenber 太 nb 了老哥,xpipe 是一直想要的😘
    javazero
        22
    javazero  
    OP
       2025 年 3 月 15 日 via Android
    @wenber 这个有监控 docker 但是缺少一些宿主机的监控。这个加上 cpu 内存 硬盘监控 无敌
    javazero
        23
    javazero  
    OP
       2025 年 3 月 15 日 via Android
    @gvdlmjwje 不是联想哈
    3wY4ZelqS1uYD4NJ
        24
    3wY4ZelqS1uYD4NJ  
       2025 年 3 月 15 日
    有代理商的需求没,可以聊一聊。tg:@shanzi2022 V:alyunflc
    sampeng
        25
    sampeng  
       2025 年 3 月 15 日 via iPhone
    完全不装软件 agent ?那没有,自己撸 ssh 后执行命令吧
    lynn1su
        26
    lynn1su  
       2025 年 3 月 18 日
    @muzihuaner 哪吒感觉有 bug ,我之前 1.9.11 版本在腾讯云上的两台服务器上安装了面板端和 agent 段,系统都是 debian 12 ,防火墙没装过,腾讯云那边的防火墙端口全开的。然后发现个问题,agent 安装完后,面板段那边没有任何机器上线,两台服务器互相 ping 是可以 ping 的通的,端口扫描也是打开的。目前有点懵逼。agent 和面板段的 tls 链接开了和关了都试过了都是不行的。所以我感觉是出 bug 了
    muzihuaner
        27
    muzihuaner  
       2025 年 3 月 18 日 via Android
    @PROJECT 我的没问题 server.quickso.cn
    muzihuaner
        28
    muzihuaner  
       2025 年 3 月 18 日 via Android
    guo4224
        29
    guo4224  
       2025 年 3 月 18 日
    自己 ssh 后+一堆脚本不如 agent
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3754 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 42ms · UTC 00:48 · PVG 08:48 · LAX 16:48 · JFK 19:48
    ♥ Do have faith in what you're doing.