V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
jonsmith
V2EX  ›  程序员

PVE 故障 500,虚拟机无法重启,如何处理?

  •  
  •   jonsmith · 10 天前 · 1965 次点击

    PVE 今天突然故障了,请教下如何处理?现象如下:

    • SSH 可以正常连接,但有些命令无法执行,reboot 重启也无效,虚拟机和宿主机都无法关机或重启
    • PVE 管理页面 local-lvm 报错:no such logical volume pve/data(500),如图

    示例图片

    第 1 条附言  ·  10 天前
    是一台 AMD 小主机,配的一块 M2 固态。用了快一年了,一直没动过。
    34 条回复    2025-01-16 16:51:52 +08:00
    yc8332
        1
    yc8332  
       10 天前
    是不是额外的磁盘没挂上,重新挂一下看看,不然就是磁盘有问题
    xiaoranj
        2
    xiaoranj  
       10 天前
    no such logical volume pve/data(500) 磁盘掉了/坏了 ?
    991547436
        3
    991547436  
       10 天前
    实体机看看 raid 挂了没
    qW7bo2FbzbC0
        4
    qW7bo2FbzbC0  
       10 天前
    开 ssh ,我帮你远程看下
    coldle
        5
    coldle  
       10 天前
    感觉是盘挂了,建议描述下硬件情况
    jonsmith
        6
    jonsmith  
    OP
       10 天前
    @yc8332 最近没动过硬盘,怎么重新挂载?
    jonsmith
        7
    jonsmith  
    OP
       10 天前
    @xiaoranj 别啊,这个 AMD 小主机,刚用了没一年呢
    jonsmith
        8
    jonsmith  
    OP
       10 天前
    @qW7bo2FbzbC0 内网机器不方便远程呢
    jonsmith
        9
    jonsmith  
    OP
       10 天前
    @coldle AMD 小主机,配的一块 M2 固态 1T ,常年开着,跑一些 docker ,平时开发用
    aru
        10
    aru  
       10 天前
    看下主机在线时间,如果没重启过,就是硬盘坏了
    aru
        11
    aru  
       10 天前
    大概率硬盘挂了,重新接下 m2 再开机吧
    如果开不了,那只能换硬盘重装系统了
    totoro625
        12
    totoro625  
       10 天前
    目测 SSH 能连接,fdisk 把 locla-lvm 分区容量扣 10G 下去
    jonsmith
        13
    jonsmith  
    OP
       10 天前
    @aru 如果是硬盘坏了,为啥 SSH 能连接,文件内容也能看到。好奇怪
    jonsmith
        14
    jonsmith  
    OP
       10 天前
    @totoro625 怎么执行?在 pve 终端执行命令都返回:-bash: /usr/bin/*: Input/output error
    kokutou
        16
    kokutou  
       10 天前
    df -h
    pvs
    vgs
    lvs -a
    fdisk -l
    lsblk
    blkid
    都贴一下吧
    kkk123
        17
    kkk123  
       10 天前
    dmesg
    journalctl -e
    看看日志里的 error
    jonsmith
        18
    jonsmith  
    OP
       10 天前
    jonsmith
        19
    jonsmith  
    OP
       10 天前
    @kkk123 上面是日志,麻烦看下
    aru
        20
    aru  
       10 天前
    @jonsmith
    -bash: /usr/bin/*: Input/output error 这就是硬盘读取失败最明显的信息
    硬盘坏了,但是常用文件在内存缓存内,所以直接读内存返回了
    别挣扎了,就是硬盘故障。如果有重要的小文件,可以尝试备份下
    然后关机重新接下硬盘,看能不能恢复(有时候接口问题或硬盘、控制器过热,重新接下可能会恢复)
    aru
        21
    aru  
       10 天前
    你的日志也指向了硬盘故障
    不信群里大佬的分析,你就让 AI 分析日志吧
    guanzhangzhang
        22
    guanzhangzhang  
       10 天前
    终端上 Input/output error 就是盘坏掉了,而且你这前面的路径是系统盘路径。
    vm 上能 ssh 就 ssh 上去把数据备份下。然后准备一个 ISO 的 Linux 启动到内存修复下 pve 的系统盘试试
    1462326016
        23
    1462326016  
       10 天前
    前段时间刚坏过一块硬盘,也是一样的 Input/output error ,只不过我的是数据盘,不是系统盘,也是一块固态,所以确定是硬盘坏了,不要重启,抓紧时间备份换硬盘吧,重启了可能就起不来了
    snoopygao
        24
    snoopygao  
       10 天前
    有一定概率重启自动 fsck 就好了
    jonsmith
        25
    jonsmith  
    OP
       10 天前
    @1462326016 测试机,倒没什么重要数据,就是要重新安装一遍,烦。这吊固态没有 nas 的机械盘稳
    jonsmith
        26
    jonsmith  
    OP
       10 天前
    @snoopygao 嗯嗯,晚点我试试
    SSang
        27
    SSang  
       10 天前
    大概率是你改了 ip 或者 hostname 导致的
    SSang
        28
    SSang  
       10 天前
    不对,应该就是磁盘掉了,不一定是磁盘问题,也有可能是主板问题。

    你应该 fsck 先尝试修复,不行的话,试试换到别的主板上。如果别的主板也不行,那就是磁盘换了
    kkk123
        29
    kkk123  
       9 天前
    pve -> Disk/磁盘下看看 SMART 状态,有可能是死期到了
    jonsmith
        30
    jonsmith  
    OP
       9 天前
    @kkk123 强制关电源重启,又恢复正常了,哈哈。SMART 状态健康,硬盘没问题。这个问题真奇怪。
    https://minio.hoopan.net/lobe/files/482485/5772a536-3060-4df4-9b41-5d9de1cf306f.png
    XiaoBu1
        31
    XiaoBu1  
       9 天前
    推荐用 pbs ,出问题直接删了虚拟机再恢复
    comlewin
        32
    comlewin  
       9 天前
    你这问题我前两天刚遇到过,报错日志一样,不过宿主机无法 ssh 登录,只能重启,重启后恢复正常。网上查了下资料应该是掉盘了,要么是硬盘问题要么是电源的问题,ssd 是三星的 990OPRO 新的用了不到一个月,网上有反馈 990pro 有掉盘的缺陷,但是我的应该是电源问题,我前段时间在主板 bios (华硕 b650M )上开启了最大节省电能的开关。
    jonsmith
        33
    jonsmith  
    OP
       9 天前
    @comlewin 我高兴早了,读写稍微多一点,磁盘 IO 速度会变慢、甚至超时。监测了硬盘温度不高,搞不清楚啥问题。晚点把硬盘拆下来测试下。
    jonsmith
        34
    jonsmith  
    OP
       9 天前
    @XiaoBu1 嗯嗯,以后加上备份
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2409 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 09:05 · PVG 17:05 · LAX 01:05 · JFK 04:05
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.