openEuler-24.03安装ARM64版本NVIDIA GPU驱动失败

在openEuler-24.03安装ARM64版本NVIDIA GPU驱动时使用默认的安装选项会安装失败.
比如,直接执行安装命令#sh ./NVIDIA-Linux-aarch64-570.124.06.run,会出现如下log:
ERROR: Installation has failed. Please see the file ‘/var/log/nvidia-installer.log’ for details. You may find suggestions on fixing installation problems in the README available on the Linux driver download page at www.nvidia.com.
打开/var/log/nvidia-installer.log,可以看到出现错误的位置如下:

根据对比定位出现问题的原因是少了参数 –install-libglvnd,所以 针对ARM64安装纯净的NVIDIA GPU驱动应该使用如下命令:
#sh ./NVIDIA-Linux-aarch64-570.124.06.run --install-libglvnd

另外除了上述版本有问题外,我们也发现 NVIDIA-Linux-aarch64-560.35.03.run版本有类似的问题,早期的版本没有该问题,确认问题为后续版本引入.

可以给个驱动的下载链接吗

这个是我验证过的版本:
Cuda驱动下载链接:
#wget https://developer.download.nvidia.com/compute/cuda/12.8.1/local_installers/cuda_12.8.1_570.124.06_linux.run

Linux驱动下载链接:
#wget https://uk.download.nvidia.com/tesla/570.124.06/NVIDIA-Linux-x86_64-570.124.06.run

ARM64版本官方下载地址:
Cuda驱动下载链接:
#wget https://developer.download.nvidia.com/compute/cuda/12.8.1/local_installers/cuda_12.8.1_570.124.06_linux_sbsa.run

Linux驱动下载链接:
#wget https://uk.download.nvidia.com/tesla/570.124.06/NVIDIA-Linux-aarch64-570.124.06.run

另外看到你贴的错误提示,有可能失败的原因如下:
1.按照的kernel-devel包的版本跟当前运行的kernel版本不一致.
2.内核安装了开源版本的GPU驱动nouveau.
你可以排除下问题.


老师您麻烦看一下,就一直是之前的报错

显卡是4090

560.35.03版的也试了,还是这样

你的这个显卡应该不是装这个驱动,这个驱动是针对tesla高端显卡的驱动,你找下4090版本的显卡驱动。

你通过这页面下载,筛选下4090的显卡驱动。

换了一张t4还是这个问题

是有点奇怪,我在泰山-200 ARM64服务器上没有遇到你说的问题呢,你看下/var/log/nvidia-installer.log里面记录的安装到哪个步骤出错了。