服务器宕机重启,请问如何分析原因

系统:openEuler-20.03-LTS-SP3-aarch64
CPU:FT5000C
内核:vmlinuz-4.19.90-2401.1.0.0233.oe1.aarch64

发现服务异常,10分钟左右恢复,登录服务器查看message日志如下:

/var/crash有kdump文件,vmcore-dmesg.txt文件最后又保存信息


还有vmcore文件,应该如何分析?

应该是硬件内存模块问题触发的,找硬件服务商查查

从log来看,这种问题不用排查软件了,是内存条硬件本身出错,被系统捕捉到,然后进入异常处理,导致系统重启,那些打出来的调用栈就是异常处理函数打出来的。估计该内存条已经处于不稳定状态,随时有可能再次出问题,建议更换出问题的内存条。


但是看BMC硬件事件日志,也没用异常,只是监测到了系统软关机指令(BMC时间跟系统时间差8小时),vmcore文件,应该如何分析,能否分析出具体原因?