V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
WinkeyLin
V2EX  ›  宽带症候群

R2S 每天晚上准时死机,如何排查

  •  
  •   WinkeyLin · 2022-11-12 01:40:28 +08:00 · 2814 次点击
    这是一个创建于 745 天前的主题,其中的信息可能已经有所发展或是发生改变。

    现在 R2S 做主路由,用的是最多人推荐的骷髅头固件 https://github.com/DHDAXCW/NanoPi-R2S-rk3328 ,Docker 全插件版,只挂了青龙面板和小猫咪,内存占用 50%。5V3A 电源 A1 卡,平常工作温度 50 度左右,高负载或者跑压测都没问题。 但就是每天晚上 12:45 准时死机,哪怕我设置 12:40 分自动重启一到 45 分都会死,只有重启才能解决。Crontab 里没有相关命令,系统日志里也压根没有这个时间段的信息,请教一下 V 友们还有可能是什么原因?

    antness
        1
    antness  
       2022-11-12 01:57:41 +08:00
    规律性好强,排查应该不会太烧脑,插眼,我来学习方法
    antness
        2
    antness  
       2022-11-12 01:59:13 +08:00
    对了,是死机吗,不是关机或者重启?会不会程序掉 bad loop 里了
    WinkeyLin
        3
    WinkeyLin  
    OP
       2022-11-12 02:54:10 +08:00
    @antness 是死机,电源灯常亮,但网络直接瘫痪,SSH 也连不上
    系统日志记录等级我已经选到 debug 了还是没有捕捉到任何信息,内核日志我不知道怎么保存,重启之后就看不到旧的记录了
    tril
        4
    tril  
       2022-11-12 03:18:54 +08:00   ❤️ 2
    排查所有插件的定时参数,比如自动更新 ddns 、自动更新订阅、自动运行脚本等。
    排查所有家庭电器的定时参数,比如微波炉、空调、电视机、智能插座等。
    禁用 NTP ,修改系统的时间到 12:40 ,看看到点之后会不会触发死机。
    提前连接 SSH ,打开 top/htop ,等待死机,看看死之前什么东西占用高。
    拔掉所有网线,看看还会不会复现。
    逐步停掉所有插件,看看还会不会复现。
    ……
    tux
        5
    tux  
       2022-11-12 08:33:36 +08:00
    是不是 12:45 上层会重新拨号?
    estk
        6
    estk  
       2022-11-12 09:11:28 +08:00 via Android
    我用官方固件,一直很稳
    想不出需要用第三方固件的理由
    niantoudeyisi
        7
    niantoudeyisi  
       2022-11-12 09:28:40 +08:00
    = =准时死机没遇到过。
    建议换个固件(/doge)
    Luvoratorrrrry
        8
    Luvoratorrrrry  
       2022-11-12 10:47:13 +08:00
    遇到问题还是针对问题做排查,换固件或许很有用,但不是好主意
    antness
        9
    antness  
       2022-11-12 11:03:46 +08:00 via Android
    @tril 学习了,ps:我也想到过会不会是外部造成干扰,比如微波炉什么的哈哈
    haikouwang
        10
    haikouwang  
       2022-11-12 12:19:06 +08:00
    找卖家售后啊。试试刷一下骷髅头的固件。
    galaxyskyknight2
        11
    galaxyskyknight2  
       2022-11-12 23:41:42 +08:00
    看看 crontab 里有没有那个 coremark.sh ,是不是设置的 12:45 ,把那玩意儿给删了。
    aru
        12
    aru  
       2022-11-13 20:46:13 +08:00
    应该不是死机,是网络挂了。
    肯定是这时候有一个定时任务执行,看能不能找到。
    crontab -l
    ls /etc/cron.*

    上面两个命令输出看下
    如果找不到,建议提前连上本地显示,等死机后,看下键盘输入还有没有反应
    icelake
        13
    icelake  
       2022-11-13 20:46:15 +08:00
    我也觉得 @tril 说的方法很实用,就是手动调节时间到 12:40 ,与真实时间错开,之后观察会不会 45 死机。
    如果死机,那八成就是系统内部问题,重点排查计划任务。
    如果不死机了,估计就是跟外部环境有关,特别是光猫宽带之类,同样的,拔掉光猫测试来排除。
    真的挺好奇 LZ 的这个故障真实原因的,期待 LZ 能顺利解决。
    aru
        14
    aru  
       2022-11-13 20:48:50 +08:00
    看了下,r2s 没显示接口,只能接 ttl
    你需要买一个 usb 转 ttl 的小板和排线,通过 putty 来连 console
    martinMao
        15
    martinMao  
       2022-11-14 09:17:56 +08:00 via iPhone
    R2s 就这个性能。。我也用的这个。1 个月多一点就会死机。千兆测速只能跑 5 。600 。看了一下 htop 。测速的时候双核跑满。其他的围观。我装的是骷髅头稳定版。docker 这种都不带的。已经买了 x86 机器了。打算换了他了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3443 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 37ms · UTC 12:06 · PVG 20:06 · LAX 04:06 · JFK 07:06
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.