N5105部署PVE虚拟机随机崩溃或软重启的解决方案

发布于 / 系统运维 / 3 条评论

本人设备

畅网 CW-N5105-NAS 妖板 部署PVE版本为7.3-3 直通i226-V 给Openwrt和黑群晖使用,黑群晖还直通了SATA控制器和核显

问题描述:

出现假死现象,VNC无响应,网卡失联,但PVE显示虚拟机正常
出现虚拟机VNC可操作,但网卡失联,pve报错:internal error
有时在空载时重启,有时在qbittorrent多任务下载时触发,有时在emby播放视频时触发
大多数情况下崩溃发生时也不会有任何异常日志记录,日志打开只有正常的重启引导日志
偶尔会在pve系统日志中发现KVM internal error ,此时只能通过VNC或串口控制台来登陆

我的解决方案:

下载内核“pve-kernel-5.19.7-2-pve_5.19.7-2_amd64.deb”

我们可以直接下到PVE中,然后安装

wget -P /root http://download.proxmox.com/debian/pve/dists/bullseye/pvetest/binary-amd64/pve-kernel-5.19.7-2-pve_5.19.7-2_amd64.deb
apt install /root/pve-kernel-5.19.7-2-pve_5.19.7-2_amd64.deb

然后重启PVE,查看内核是否已经生效,然后安装 intel-microcode

uname -r

回显应为:5.19.7-2-pve

但是intel-microcode并没有在开源软件源中,我们需要加上 non-free 源

vi /etc/apt/sources.list

在末尾加上:

deb http://ftp.us.debian.org/debian/ bullseye main contrib non-free
deb-src http://ftp.us.debian.org/debian/ bullseye main contrib non-free
deb http://security.debian.org/debian-security bullseye-security main contrib non-free
deb-src http://security.debian.org/debian-security bullseye-security main contrib non-free

wq保存之后,更新源,然后安装软件:

apt update
apt upgrade intel-microcode

reboot重启,理论上这样就修复好崩溃重启的问题了,更新的内核我没有测试,目前我用的也是 kernel-5.19.7-2 ,群晖和Openwrt已很长时间没崩溃了,理论上N5105都能修复,那应该N6005也有效。

本文基于《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权
转载原创文章请注明,转载自: 沧水的博客 » N5105部署PVE虚拟机随机崩溃或软重启的解决方案
  1. 有间咖啡馆

    换过内核、更新过微码之后还有这类现象嘛?

    1. 沧水
      @有间咖啡馆 没有任何问题了 已经稳定近半年
  2. 潜心学习的道士

    好棒!