8 卡 RTX 5090 服务器部署指南
本文档提供从 Ubuntu 系统环境配置、NVIDIA 驱动安装到 llama.cpp 多 GPU 编译与推理调优的完整流程,适配 Blackwell 架构(RTX 5090)。
一、系统与硬件准备
1.1 系统要求
- OS: Ubuntu 22.04 LTS (64 位)
- Kernel: 6.8+ HWE 内核(5090 必须高内核以支持新特性)
- Driver: 禁用 Nouveau 开源驱动,避免冲突
1.2 硬件检查
确认 8 张显卡是否被识别:
lspci | grep -i nvidia
# 应输出 8 条 NVIDIA Corporation Device 2782 (rev a1)

二、安装 NVIDIA 驱动(5090 专属流程)
2.1 卸载旧驱动与禁用 Nouveau
彻底清理环境是稳定运行的前提:
# 1. 彻底卸载旧 NVIDIA 驱动
sudo apt purge nvidia* libnvidia* -y
sudo apt autoremove -y
# 2. 禁用 Nouveau
sudo bash -c 'echo -e "blacklist nouveau\noptions nouveau modeset=0" > /etc/modprobe.d/blacklist-nouveau.conf'
sudo update-initramfs -u
# 3. 重启生效
sudo reboot

2.2 安装高版本 HWE 内核
5090 强制要求 6.8+ 内核:
# 安装 6.8+ HWE 内核
sudo apt update
sudo apt install linux-generic-hwe-22.04 -y
sudo reboot
# 验证内核版本(必须≥6.8)
uname -r







