8 卡 RTX 5090 服务器 llama.cpp 完整部署及性能调优
本文基于 Ubuntu 22.04 LTS,针对 NVIDIA Blackwell 架构(RTX 5090)提供从驱动安装、环境配置到多 GPU 推理测试的完整流程。重点解决 5090 专用驱动兼容性及 8 卡并行加速问题。
一、系统与硬件准备
1.1 系统要求
- OS: Ubuntu 22.04 LTS (64 位)
- Kernel: 6.8+ HWE 内核(5090 必须高内核以支持新特性)
- Driver: 禁用 Nouveau 开源驱动,避免冲突
1.2 硬件检查
确认 8 张显卡是否被系统正确识别:
# 查看 NVIDIA 设备
lspci | grep -i nvidia
# 应输出 8 条 "NVIDIA Corporation Device 2782 (rev a1)"

二、安装 NVIDIA 驱动(5090 专属流程)
RTX 5090(Blackwell)必须使用 open-dkms 开源内核模块驱动,闭源驱动会导致报错或无法识别。
2.1 卸载旧驱动与禁用 Nouveau
# 1. 彻底卸载旧 NVIDIA 驱动
sudo apt purge nvidia* libnvidia* -y
sudo apt autoremove -y
# 2. 禁用 Nouveau
sudo bash -c 'echo -e "blacklist nouveau\noptions nouveau modeset=0" > /etc/modprobe.d/blacklist-nouveau.conf'
sudo update-initramfs -u
# 3. 重启生效
sudo reboot















