1、英伟达驱动下载
访问官网:NVIDIA 驱动查询
1.1、根据对应显卡型号和版本进行搜索

1.2、根据查找结果,下载对应所需版本驱动

1.3、上传注意事项
下载好的驱动上传到系统时,驱动路径不能存在中文。
1.4、上传至系统
通过 xftp 或其他方式进行上传,建议上传到 ubuntu 用户家目录。

2、确认硬件状态
2.1、查看显卡是否正常被识别
lspci | grep -i nvidia
2.2、输出显卡型号及内容则硬件识别正常

3、安装必要软件 + 依赖
sudo apt -y install gcc g++ make lrzsz git vim vim-common net-tools openssh-server
4、禁用系统默认的显卡驱动
4.1、先查看是否已经禁用
无输出结果表示已经禁用。
lsmod | grep nouveau
4.2、若输出如下内容则表示未禁用

4.3、禁用方法:编辑驱动黑名单配置文件
sudo vim /etc/modprobe.d/blacklist.conf
4.4、添加如下配置文件参数,添加后保存退出
blacklist nouveau
options nouveau modeset=0

4.5、重新加载内核使黑名单配置文件生效
sudo update-initramfs -u
4.6、重启服务器并验证
重启服务器,重新执行 4.1 命令,确认无输出结果,保证默认系统显卡驱动已禁用。

5、驱动开始安装
5.1、进入命令行界面
sudo init 3
5.2、给予驱动文件可执行权限
sudo chmod +777 NVIDIA-Linux-x86_64-580.105.08.run
5.3、执行安装并添加对应参数
参数说明:
--no-opengl-files:只安装驱动文件,不安装 OpenGL 文件。--no-x-check:安装驱动时关闭 X 服务。
sudo ./NVIDIA-Linux-x86_64-580.105.08.run --no-opengl-files
5.4、过程记录

5.5、至此提示安装完成

5.6、返回图形化界面并查看显卡信息
返回图形化界面,并查看显卡列表,并记录驱动所对应 CUDA 版本(例如 13.0),在第 7 步安装时需要。
sudo init 5
nvidia-smi

6、设置内存常驻
6.1、编辑内存常驻配置文件
sudo vim /etc/rc.local
填入以下内容并保存退出:
#!/bin/sh -e
nvidia-smi -pm 1
exit 0
6.2、给予可执行权限
sudo chmod +x /etc/rc.local
6.3、重启系统后验证
nvidia-smi
7、安装 CUDA
CUDA 下载位置:CUDA Toolkit Archive
7.1、根据步骤采集信息
驱动所匹配 CUDA 版本为 13.0。

7.2、选择选项获取安装命令

7.3、执行安装
安装 CUDA 需要注意,sh 执行完成后,需要稍等,待加载完之后,会提示操作窗口。
7.4、接受协议
在界面输入 accept。

7.5、选择安装组件
驱动已经安装,无需重复安装,只安装 CUDA 相关参数,选择 install 进行安装。

7.6、安装完成

8、配置 CUDA 环境变量
8.1、编辑配置文件
sudo vim ~/.bashrc
8.2、末尾添加如下内容
内容中 X.Y 代表安装的 CUDA 版本。
export PATH=/usr/local/cuda-X.Y/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-X.Y/lib64:$LD_LIBRARY_PATH
export CUDA_HOME=/usr/local/cuda
8.3、编译环境变量
source ~/.bashrc
8.4、查看 CUDA 信息
nvcc -V
8.5、提示此信息,CUDA 安装完成

9、压力测试
9.1、下载压测文件并编译
git clone https://github.com/wilicc/gpu-burn
cd gpu-burn
make

9.2、压测 30 秒
./gpu_burn 30 # 秒数
9.3、观察压测情况
再开一个窗口,压测时进行观察。
watch nvidia-smi

10、卸载驱动及 CUDA
10.1、卸载显卡驱动
/usr/bin/nvidia-uninstall
10.2、卸载 CUDA
/usr/local/cuda-X.Y/bin/cuda-uninstaller

