PVE 配置显卡直通指南:本地部署 AI 大模型基础环境
本文将详细介绍如何在虚拟化平台 Proxmox Virtual Environment(PVE)中配置显卡直通,将宿主机上的物理显卡直接分配给 AI 虚拟机使用。通过此方案,可以充分利用 GPU 算力运行本地大语言模型(LLM),避免云端调用的延迟与成本。
1. 环境介绍
1.1 硬件环境
- 服务器主板/芯片组:支持 VT-x/VT-d 虚拟化扩展的 Intel 或 AMD 平台
- 内存:建议 32GB 及以上,确保宿主机与虚拟机均有充足资源
- 显卡:NVIDIA P104-100(或其他支持 CUDA 的 NVIDIA 显卡)
- BIOS 设置:必须开启
Intel VT-x、Intel VT-d(或 AMD-Vi) 以及Above 4G Decoding
注意:本文以 NVIDIA P104-100 为例,配置逻辑适用于大多数消费级及专业级 NVIDIA 显卡。AMD 显卡直通原理类似,但驱动配置有所不同。
1.2 软件环境
- 虚拟化平台:Proxmox VE 8.0.x 系列
- 客户机系统:Ubuntu 22.04 LTS(推荐用于 AI 开发环境)
- 内核版本:PVE 默认内核通常已包含 VFIO 支持,无需额外编译
2. 配置 PVE 宿主机开启显卡直通
在 PVE 宿主机上完成底层配置是直通成功的关键,主要涉及 IOMMU 开启、VFIO 模块加载及驱动屏蔽。
2.1 开启 IOMMU 功能
IOMMU(Input-Output Memory Management Unit)允许操作系统管理设备的 DMA 访问,是实现设备隔离和直通的基础。
-
编辑 Grub 配置文件 使用 root 权限编辑
/etc/default/grub:vi /etc/default/grub -
修改启动参数 找到
GRUB_CMDLINE_LINUX_DEFAULT行,添加以下参数:GRUB_CMDLINE_LINUX_DEFAULT="quiet intel_iommu=on iommu=pt initcall_blacklist=sysfb_init pcie_acs_override=downstream"参数说明:
intel_iommu=on:启用 Intel IOMMU 支持。iommu=pt:Performance mode,提高性能并防止 Linux 错误地直通不支持的设备。initcall_blacklist=sysfb_init:禁用系统帧缓冲初始化,避免冲突(替代旧版的video=efifb:off,vesafb:off)。pcie_acs_override=downstream:强制覆盖 PCIe ACS 能力,便于拆分 IOMMU 组,使更多设备可被单独直通。
*注:若使用 AMD CPU,请将
intel_iommu=on替换为amd_iommu=on。 -
更新 GRUB 配置
update-grub


