V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
henryshen233
V2EX  ›  NAS

用 Debian 或其他 Linux 发行版做主系统,相比于群晖的自动报警,该如何检测硬盘健康状态

  •  
  •   henryshen233 · 335 天前 · 3411 次点击
    这是一个创建于 335 天前的主题,其中的信息可能已经有所发展或是发生改变。
    如果是群晖 NAS 的话,硬盘出问题会通过手机 App 提醒,假如是 Debian 的话,该如何察觉硬盘问题
    24 条回复    2023-07-11 18:13:57 +08:00
    changnet
        1
    changnet  
       335 天前
    自己部署运维脚本(也有现成开源的运维系统),监测到有问题就发封邮件,发短信、电话都行。
    sNullp
        2
    sNullp  
       335 天前
    自己写一个脚本定期 run smart test ,让 smartmontools 自带的 daemon 遇到 test 错误就发邮件。
    或者跟我一样用 zfs ,有问题自动发邮件。
    jim9606
        3
    jim9606  
       335 天前
    smartmontools 可以后台监视,会发通知,应该有用 smtp 发邮件的方法
    ltkun
        4
    ltkun  
       335 天前 via Android
    zfs mdadmin 天天给我发邮件
    optional
        5
    optional  
       335 天前 via iPhone
    找个 exporter 然后要么 Prometheus 要么自己写个小脚本
    Hardrain
        6
    Hardrain  
       335 天前
    man smartd
    wellerman
        7
    wellerman  
       335 天前
    群晖之类的 NAS 系统,本来就是缝合怪。缝合了一堆开源工具,就拿出来卖了。
    pollux
        8
    pollux  
       335 天前
    用 smart 来监控异常,使用 shell 脚本或 python 胶水语言,调用钉钉或者飞书接口报警
    mingl0280
        9
    mingl0280  
       335 天前 via Android
    smartd(smartmontools)自动监视发邮件,然后 sendmail 和 msmtp 之类的客户端找个能用的 pop3 配置好直接邮件发到手机上。我现在就这么搞的。
    FrankAdler
        10
    FrankAdler  
       335 天前 via iPhone
    我是 pve 开了 grafana 和 prometheus ,采集 cpu 、内存啥的,加上 smart 信息应该也不难
    greenskinmonster
        11
    greenskinmonster  
       335 天前 via Android
    smartctl -H /dev/sda --json 定时检查是不是 passed 状态即可
    raptor
        12
    raptor  
       335 天前
    配置一个 smartmontools 监控啊: https://mental.we8log.com/mental/post/400/
    shijingshijing
        13
    shijingshijing  
       335 天前
    硬盘本身每那么娇气,真正靠谱的是离线冷备,RAID1 什么的都不如冷备,数据不铭感上传网盘做备份也行。群辉这种很大部分是智商税,他那个硬盘监控很多只要 SMART 数据稍微异常就给你废掉整个盘其实完全没必要,让你多花钱而已,硬盘本身就带有纠错,PList ,GList 等各种措施,只要你不用叠瓦一般都皮实的很,更高级的氦气盘防护措施更多。

    你可以看下这个新闻: https://finance.sina.com.cn/tech/2021-02-02/doc-ikftssap2457855.shtml
    oneisall8955
        14
    oneisall8955  
       334 天前 via Android
    组 RAID 不是备份
    0superx0
        15
    0superx0  
       334 天前
    折腾过 nas ,个人环境找不出什么使用场景,
    要文件共享方案,其实主机开个 smb 完事了,
    要科学上网,挂个 clash 跑机场当网关,
    除了小姐姐外,个人文件还不如挂个 webdav 网盘来得安全
    azure2023us559
        16
    azure2023us559  
       334 天前 via Android
    容灾备份才能算上真正意义上的备份。
    mikewang
        17
    mikewang  
       334 天前
    我用的成品 NAS ,也不完全信任 NAS 系统自带的自动报警。
    自己写了一个 Python 脚本定时调用 smartctl 命令。
    举个例子:`smartctl -x /dev/nvme0 -json`
    然后解析 json ,自行判断。
    mikewang
        18
    mikewang  
       334 天前
    #17 @mikewang 更正:`smartctl -x /dev/nvme0 --json`,漏打一个横杠。
    Zhouisme
        19
    Zhouisme  
       334 天前
    cron + brank ,配合一种语言
    1.cron 定时执行程序 bash.sh ,grep 获取想要的硬盘 status ,加以判断,或者直接存为环境变量。py 、go 去获取环境变量判断。
    2.py 、go 手写一个发送 get 的小程序,被 bash.sh 调用。
    3.brank 只能用于 iOS 。

    这是最简单最轻量的吧,智力负担也小。
    Zhouisme
        20
    Zhouisme  
       334 天前
    @Zhouisme

    补充,不会 py 、go 等编程语言也没问题。用 curl 发送 get 请求即可。复杂度又降低了。
    laucenmi
        21
    laucenmi  
       334 天前
    @FrankAdler pve 硬盘有故障会自己发送邮件,就是安装的时候填写的 email 地址
    gvdlmjwje
        22
    gvdlmjwje  
       334 天前 via Android
    如果是物理服务器,用 bmc 的硬件告警功能
    FrankAdler
        23
    FrankAdler  
       333 天前
    @laucenmi 那还挺好
    xinyu391
        24
    xinyu391  
       282 天前
    @wellerman 如果用了 gpl 的开源代码,可以要求群晖 开源 他们的代码啦
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   4742 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 09:53 · PVG 17:53 · LAX 02:53 · JFK 05:53
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.