在CentOS上安装NVIDIA显卡驱动是一个涉及多个步骤的过程,以下是一个详细的指南,包括安装前的准备、驱动的安装、CUDA和cuDNN的安装,以及验证安装是否成功:
一、安装前的准备工作
1、确定显卡型号:
使用命令lspci | grep i nvidia
或lspci | grep i vga
来查找显卡型号。
2、禁用默认的nouveau驱动(可选):
如果计划安装NVIDIA显卡驱动,建议禁用默认的nouveau驱动。
编辑/etc/default/grub
文件,添加rd.driver.blacklist=nouveau nouveau.modeset=0
行。
保存并关闭文件后,运行sudo grub2mkconfig o /boot/grub2/grub.cfg
以使更改生效。
3、安装必要的依赖软件包:
使用命令sudo yum install kerneldevel kernelheaders gcc make dkms epelrelease
来安装常见的依赖软件包。
二、安装NVIDIA显卡驱动
1、下载驱动程序:
访问NVIDIA官方网站,根据显卡型号选择并下载相应的驱动程序。
2、上传并添加执行权限:
将下载后的驱动安装包上传到主机,并对安装包添加执行权限:chmod +x NVIDIALinuxx86_64xxx.xx.run
。
3、安装驱动程序:
执行驱动安装程序,并按照提示进行操作:sudo ./NVIDIALinuxx86_64xxx.xx.run
。
安装过程中可能需要指定内核源码路径,可以使用kernelsourcepath=/usr/src/kernels/$(uname r)
参数。
4、完成安装并重启系统:
按照安装程序的提示完成安装,并在完成后重启系统:sudo reboot
。
三、安装CUDA和cuDNN
1、下载CUDA ToolKit:
访问NVIDIA官方网站,下载与驱动程序兼容的CUDA ToolKit版本。
2、安装CUDA ToolKit:
对下载的CUDA安装包添加执行权限,并运行安装程序:chmod +x cuda_x.x.x_linux.run && sudo ./cuda_x.x.x_linux.run
。
在安装过程中,取消勾选“Install NVIDIA driver”选项(如果已安装驱动程序)。
3、配置环境变量:
编辑~/.bashrc
文件,添加CUDA和cuDNN的路径到环境变量中:
export PATH=/usr/local/cuda/bin${PATH:+:${PATH}} export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
使环境变量生效:source ~/.bashrc
。
4、下载并安装cuDNN:
根据CUDA版本下载对应的cuDNN库,并将其复制到CUDA目录中。
四、验证安装是否成功
1、验证NVIDIA驱动是否安装成功:
使用命令nvidiasmi
查看GPU信息,如果返回了正确的GPU信息,则说明驱动安装成功。
2、验证CUDA是否安装成功:
使用命令nvcc V
查看CUDA编译器版本,如果返回了正确的版本信息,则说明CUDA安装成功。
五、常见问题及解答FAQs
Q1: 如何卸载已安装的NVIDIA驱动?
A1: 要卸载已安装的NVIDIA驱动,可以使用以下步骤:
确保你处于终端界面(非图形界面)。
使用以下命令卸载驱动:
sudo ./NVIDIALinuxx86_64xxx.xx.run uninstall
或者,如果你已经安装了多个版本的驱动,可以使用以下命令列出所有已安装的驱动,并选择要卸载的版本:
sudo nvidiauninstall
重启系统以使更改生效。
Q2: 如何解决安装NVIDIA驱动时出现的“ERROR: Your appear to be running an X server; Please exit X before installing.”错误?
A2: 这个错误通常是因为你在图形界面下尝试安装NVIDIA驱动,为了解决这个问题,你需要退出图形界面并切换到终端模式,你可以使用以下步骤:
按下Ctrl+Alt+F1
组合键切换到第一个虚拟控制台(TTY1)。
登录后,停止图形界面服务:
sudo systemctl stop gdm
你可以在没有图形界面的情况下安装NVIDIA驱动了,安装完成后,重新启动图形界面服务:
sudo systemctl start gdm
按下Ctrl+Alt+F7
组合键切换回图形界面。