查询英伟达官网,没有支持Linux6.6内核的CUDA版本
英伟达官方确实没有在支持列表中明确标明支持openEuler-24.03,也就是说他们没有专门在openEuler-24.03上做验证。根据他们官方的文档要求的内核版本,gcc版本,openEuler-24.03都在这个范围,支持上没什么问题。openEuler-24.03使用的内核版本为kernel-6.6和glibc-2.38,以及gcc-12.3.1.下图是截自560.35.03版本的Release notes.
所以整体的软件版本稍高于官方验证过的ubuntu-22.04,低于ubuntu-24.04,所以在兼容性方面应该没什么大的问题。
所以用12.6版本的CUDA应该是没问题的,没理解错吧
下载的时候,系统选择什么呢?
是的,使用12.6的没啥问题
想省事的话,你可以从社区的仓库上下就行,包含有X64和ARM64的版本,这个仓库中的驱动是验证过的,也是来自英伟达官方:Index of /rpm/openEuler-24.03-LTS/contrib/drivers/
好的 谢谢大佬!
这个问题我应该可以回答,前几天刚刚操练过,还是离线安装的——物理断网的,下载文件很麻烦。
x86_64平台,nvidia A40。 安装 cuda 12.8,下载 fedola 或 redhat 下的,但不要 rpm 包,可能各种依赖不一样,不行。就下载 .run
文件,可也。
我下载了好多,有cuda,还有 驱动,其实只需要cuda一个就可以了,内含驱动程度。即: cuda_12.4.0_550.54.14_linux.run
, cuda 12.4, 驱动为 550.54。
我没有安装 12.8 ,担心 pytorch 有问题,没有试。后面安装了 ollama ,至少 12.4 是可以用的。
谢谢大佬提供的思路,所以说是不需要nvidia驱动,直接装cuda就行了哇。下周试试,这周因为服务器没转接卡,显卡还没装上。
解决方案为
1、禁用系统驱动。
2、下载社区仓库提供的cuda包安装,我用的是12.6
3、加PATH
export PATH=/usr/local/cuda-12.6/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-12.6/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda-12.6
4、用nvidia-smi命令查看显卡、nvcc -V 查看cuda驱动
系统:openEuler 24.03 LTS SP1最精简版本安装显卡驱动
服务器:超微4028
显卡:3090 24G*8
内核版本:6.6.0-77.0.0.81.oe2403sp1.x86_64
尝试了很多个版本的驱动,都会出现以下报错
[root@localhost tmp]# nvidia-smi
NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
大佬们,这个是因为什么呀,装1天了,各种测试,还是不对
禁用系统驱动了吗
禁用了。
请问下有22.03-sp2使用哪个cuda版本?
X64的使用这个,这个是在openEuler-22.03上验证过的
https://repo.oepkgs.net/openEuler/rpm/openEuler-22.03-LTS/contrib/drivers/x86_64/Packages/cuda_12.2.0_535.54.03_linux.run
如果是ARM64的话使用这个, 这个也在openEuler-22.03上验证过的:
https://repo.oepkgs.net/openEuler/rpm/openEuler-22.03-LTS/contrib/drivers/aarch64/Packages/cuda_12.2.0_535.54.03_linux_sbsa.run