V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要把任何和邀请码有关的内容发到 NAS 节点。

邀请码相关的内容请使用 /go/in 节点。

如果没有发送到 /go/in,那么会被移动到 /go/pointless 同时账号会被降权。如果持续触发这样的移动,会导致账号被禁用。
henryshen233
V2EX  ›  NAS

用 Debian 或其他 Linux 发行版做主系统,相比于群晖的自动报警,该如何检测硬盘健康状态

  •  
  •   henryshen233 · 2023-05-20 12:05:42 +08:00 · 3809 次点击
    这是一个创建于 534 天前的主题,其中的信息可能已经有所发展或是发生改变。
    如果是群晖 NAS 的话,硬盘出问题会通过手机 App 提醒,假如是 Debian 的话,该如何察觉硬盘问题
    24 条回复    2023-07-11 18:13:57 +08:00
    changnet
        1
    changnet  
       2023-05-20 12:10:18 +08:00
    自己部署运维脚本(也有现成开源的运维系统),监测到有问题就发封邮件,发短信、电话都行。
    sNullp
        2
    sNullp  
       2023-05-20 12:10:44 +08:00
    自己写一个脚本定期 run smart test ,让 smartmontools 自带的 daemon 遇到 test 错误就发邮件。
    或者跟我一样用 zfs ,有问题自动发邮件。
    jim9606
        3
    jim9606  
       2023-05-20 12:13:04 +08:00
    smartmontools 可以后台监视,会发通知,应该有用 smtp 发邮件的方法
    ltkun
        4
    ltkun  
       2023-05-20 12:23:34 +08:00 via Android
    zfs mdadmin 天天给我发邮件
    optional
        5
    optional  
       2023-05-20 12:31:15 +08:00 via iPhone
    找个 exporter 然后要么 Prometheus 要么自己写个小脚本
    Hardrain
        6
    Hardrain  
       2023-05-20 12:51:10 +08:00
    man smartd
    wellerman
        7
    wellerman  
       2023-05-20 13:11:23 +08:00
    群晖之类的 NAS 系统,本来就是缝合怪。缝合了一堆开源工具,就拿出来卖了。
    pollux
        8
    pollux  
       2023-05-20 15:22:16 +08:00
    用 smart 来监控异常,使用 shell 脚本或 python 胶水语言,调用钉钉或者飞书接口报警
    mingl0280
        9
    mingl0280  
       2023-05-20 15:31:15 +08:00 via Android
    smartd(smartmontools)自动监视发邮件,然后 sendmail 和 msmtp 之类的客户端找个能用的 pop3 配置好直接邮件发到手机上。我现在就这么搞的。
    FrankAdler
        10
    FrankAdler  
       2023-05-20 16:26:27 +08:00 via iPhone
    我是 pve 开了 grafana 和 prometheus ,采集 cpu 、内存啥的,加上 smart 信息应该也不难
    greenskinmonster
        11
    greenskinmonster  
       2023-05-20 16:37:50 +08:00 via Android
    smartctl -H /dev/sda --json 定时检查是不是 passed 状态即可
    raptor
        12
    raptor  
       2023-05-20 17:32:57 +08:00
    配置一个 smartmontools 监控啊: https://mental.we8log.com/mental/post/400/
    shijingshijing
        13
    shijingshijing  
       2023-05-20 17:40:50 +08:00
    硬盘本身每那么娇气,真正靠谱的是离线冷备,RAID1 什么的都不如冷备,数据不铭感上传网盘做备份也行。群辉这种很大部分是智商税,他那个硬盘监控很多只要 SMART 数据稍微异常就给你废掉整个盘其实完全没必要,让你多花钱而已,硬盘本身就带有纠错,PList ,GList 等各种措施,只要你不用叠瓦一般都皮实的很,更高级的氦气盘防护措施更多。

    你可以看下这个新闻: https://finance.sina.com.cn/tech/2021-02-02/doc-ikftssap2457855.shtml
    oneisall8955
        14
    oneisall8955  
       2023-05-20 18:14:00 +08:00 via Android
    组 RAID 不是备份
    0superx0
        15
    0superx0  
       2023-05-20 21:20:58 +08:00
    折腾过 nas ,个人环境找不出什么使用场景,
    要文件共享方案,其实主机开个 smb 完事了,
    要科学上网,挂个 clash 跑机场当网关,
    除了小姐姐外,个人文件还不如挂个 webdav 网盘来得安全
    azure2023us559
        16
    azure2023us559  
       2023-05-20 21:23:49 +08:00 via Android
    容灾备份才能算上真正意义上的备份。
    mikewang
        17
    mikewang  
       2023-05-20 23:07:47 +08:00
    我用的成品 NAS ,也不完全信任 NAS 系统自带的自动报警。
    自己写了一个 Python 脚本定时调用 smartctl 命令。
    举个例子:`smartctl -x /dev/nvme0 -json`
    然后解析 json ,自行判断。
    mikewang
        18
    mikewang  
       2023-05-20 23:13:51 +08:00
    #17 @mikewang 更正:`smartctl -x /dev/nvme0 --json`,漏打一个横杠。
    Zhouisme
        19
    Zhouisme  
       2023-05-21 03:56:19 +08:00
    cron + brank ,配合一种语言
    1.cron 定时执行程序 bash.sh ,grep 获取想要的硬盘 status ,加以判断,或者直接存为环境变量。py 、go 去获取环境变量判断。
    2.py 、go 手写一个发送 get 的小程序,被 bash.sh 调用。
    3.brank 只能用于 iOS 。

    这是最简单最轻量的吧,智力负担也小。
    Zhouisme
        20
    Zhouisme  
       2023-05-21 03:58:42 +08:00
    @Zhouisme

    补充,不会 py 、go 等编程语言也没问题。用 curl 发送 get 请求即可。复杂度又降低了。
    laucenmi
        21
    laucenmi  
       2023-05-21 10:53:38 +08:00
    @FrankAdler pve 硬盘有故障会自己发送邮件,就是安装的时候填写的 email 地址
    gvdlmjwje
        22
    gvdlmjwje  
       2023-05-21 14:51:19 +08:00 via Android
    如果是物理服务器,用 bmc 的硬件告警功能
    FrankAdler
        23
    FrankAdler  
       2023-05-22 00:16:17 +08:00
    @laucenmi 那还挺好
    xinyu391
        24
    xinyu391  
       2023-07-11 18:13:57 +08:00
    @wellerman 如果用了 gpl 的开源代码,可以要求群晖 开源 他们的代码啦
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   971 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 22:03 · PVG 06:03 · LAX 14:03 · JFK 17:03
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.