如题所示
docker 20+ 以上用 nvidia-container-toolkit 代替 nvidia-docker2
因为nvidia不支持 openeuler 又因为 openeuler22.03 是根据centos8.4 改的所以我用cenots8的源
设置欺骗nvidia,下载centos8的源
distribution=centos8 &&
curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.repo |
tee /etc/yum.repos.d/nvidia-container-toolkit.repo
缓存
dnf makecache
安装
dnf install -y nvidia-container-toolkit
测试
nvidia-ctk --version
NVIDIA Container Toolkit CLI version 1.13.1
commit: 28b70663f1a2b982e59e83bcf1844177dc745208
用容器测试下 参数
–runtime=nvidia --gpus all
暂时没nvidia tesla v100 就没有测试,希望大神用容器测试下,当然显卡驱动能不能安装成功还是未知数
我这边搭建ngc环境的时候简单安装了下,以下是我使用的软件和硬件信息
openEuler 22.03 LTS x86
Tesla A100
cuda 12.2.2
docker 20+
NVIDIA Container Toolkit
安装过程和上面差不多,在配置docker时dockerd会报错,但是不影响docker + nvidia gpu的使用