8 卡 RTX 5090 服务器 llama.cpp 部署与测试指南
完整安装及性能调优指南
本文介绍从 NVIDIA 驱动安装、CUDA 环境配置到 llama.cpp 编译及多 GPU 测试的完整流程(基于 Ubuntu 22.04 LTS,适配 Blackwell 架构)。
一、系统与硬件准备
1.1 系统要求
- 推荐:Ubuntu 22.04 LTS(64 位)
- 内核:6.8+ HWE 内核(5090 必须高内核)
- 禁用:Nouveau 开源驱动(与 NVIDIA 驱动冲突)
1.2 硬件检查
# 查看 8 张 5090 是否被识别
lspci | grep -i nvidia
# 应输出 8 条 NVIDIA Corporation Device 2782 (rev a1)
二、安装 NVIDIA 驱动(5090 专属流程)
2.1 卸载旧驱动与禁用 Nouveau
# 1. 彻底卸载旧 NVIDIA 驱动
sudo apt purge nvidia* libnvidia* -y
sudo apt autoremove -y
# 2. 禁用 Nouveau
sudo bash -c 'echo -e "blacklist nouveau\noptions nouveau modeset=0" > /etc/modprobe.d/blacklist-nouveau.conf'
sudo update-initramfs -u
# 3. 重启生效
sudo reboot
2.2 安装高版本 HWE 内核(5090 强制要求)
# 安装 6.8+ HWE 内核
sudo apt update
sudo apt install linux-generic-hwe-22.04 -y
sudo reboot
# 验证内核版本(必须≥6.8)
uname -r
# 输出示例:6.8.0-45-generic
2.3 安装 5090 专用开源驱动(-open)
RTX 5090(Blackwell)必须用 open-dkms 开源内核模块驱动,闭源驱动会报错。
# 添加显卡驱动 PPA
sudo add-apt-repository ppa:graphics-drivers/ppa -y
sudo apt update
# 安装 590-open 驱动(5090 推荐)
sudo apt install nvidia-driver-590-open -y
reboot
nvidia-smi

