22.03 LTS版本概率出现reboot无响应或者延迟很长时间机器才重启

服务器:海光CPU
操作系统版本:22.03 LTS
操作方法:reboot命令
现象:ssh仍能登录,并未进入重启流程。概率出现该情况。可能在热插拔盘出现。
日志:dmesg中有打印device-mapper


如果有进程在跑,可能reboot不立刻生效。reboot -f是强制重启。

reboot -f方式试过,但是也是没有效果。有进程在跑,有什么办法可以查询到,到底哪个进程在影响重启?

可以试试coredump ,看下结束进程的时候卡在哪个进程了

是个好方法,我试试看看能不能抓到。谢谢

coredump怎么抓呢,使用gcore 产生的core文件。再用gdb分析不了,反馈格式不正确。
我从服务器重启任务里面看到了nginx stop 时间一直等待到15min


应该是nginx停止任务耗费太长时间

最终结论:nginx服务停止超时,导致了reboot延迟重启

此话题已在最后回复的 24 小时后被自动关闭。不再允许新回复。