在安装 CUDA 和 NVIDIA 驱动之前,首先需要更新系统,以确保所有软件包都是最新版本
展开代码sudo dnf update -y
更新软件包存储库缓存,以便 DNF 能够获取最新的软件包信息
展开代码sudo dnf makecache
启用 CentOS Stream 9 的 CRB(CodeReady Builder)存储库,该存储库包含一些额外的软件包
展开代码sudo dnf config-manager --set-enabled crb
安装 EPEL(Extra Packages for Enterprise Linux)和 EPEL-Next 软件包,这些软件包提供了额外的工具和库
展开代码sudo dnf install epel-release epel-next-release
需要确认安装、确认GPG密钥,按y
展开代码sudo dnf makecache
重启系统,使得更改全部生效
展开代码sudo dnf install kernel-headers-$(uname -r) kernel-devel-$(uname -r) tar bzip2 make automake gcc gcc-c++ pciutils elfutils-libelf-devel libglvnd-opengl libglvnd-glx libglvnd-devel acpid pkgconfig dkms
要确认安装、确认GPG密钥,按y
展开代码sudo dnf config-manager --add-repo http://developer.download.nvidia.com/compute/cuda/repos/rhel9/$(uname -i)/cuda-rhel9.repo
展开代码sudo dnf clean all sudo dnf makecache
展开代码sudo dnf -y install cuda-toolkit-12-8 sudo dnf module install nvidia-driver:570-open
展开代码sudo reboot
为方便使用 CUDA 工具,配置环境变量:
编辑 ~/.bashrc,添加以下行:
展开代码export PATH=/usr/local/cuda/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
应用更改:
展开代码source ~/.bashrc
注意:默认安装路径为 /usr/local/cuda,若为 /usr/local/cuda-12.4,请确认路径(使用 which nvcc)。
检查CUDA版本
展开代码nvcc --version
检查GPU状态
展开代码nvidia-smi
示例:

官方应该是跳过了cuda12.7版本的发布,直接将12.6更新为12.8,现在更新到13.0,所以在 NVIDIA 官方网站上无法找到 CUDA 12.7 的下载链接,甚至下载命令相同,只替换版本号也会显示找不到该版本
对于使用nvidia-smi命令,显示CUDA Version 12.7的问题,可能的原因:
nvidia-smi 可能会显示 CUDA 12.7,但实际上系统中并没有安装 CUDA 12.7 的工具包。PATH 环境变量可能包含了指向旧版本 CUDA 的路径,而 nvidia-smi 显示的是驱动程序支持的版本。nvidia-smi 可能会显示 CUDA 12.7。这是因为 nvidia-smi 显示的是驱动程序支持的 CUDA 版本,而不是实际安装的 CUDA 工具包版本。展开代码sudo dnf -y remove cuda-toolkit-12-8
展开代码sudo dnf -y install cuda-toolkit-xx-x # 注意要安装的版本
展开代码sudo dnf module remove nvidia-driver:570-open
展开代码sudo dnf module reset nvidia-driver
展开代码sudo dnf module install nvidia-driver:xxx-open # 确定要安装的版本
CUDA Toolkit 12.6 Update 3 下载 |NVIDIA 开发人员
本文作者:zzz
本文链接:
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!