Windows 上安装 Python-vLLM 的两种方法

在 Windows 上安装 vLLM 主要有两种方式:通过已发布的 wheel 包安装和从源码构建安装。
一、通过现有发布的 wheel 包安装(推荐)

文件示例:vllm-0.11.0+cu124-cp312-cp312-win_amd64.whl
1. 确认版本兼容性
确保 Python、PyTorch 和 CUDA 版本与 wheel 包要求一致(具体版本信息见发布页面)。
2. 下载 wheel 包
从 最新发布页面 下载作者提供的版本。注意:torch 和 CUDA 版本高于发布版也能安装成功,但可能拉取大量依赖导致冲突(如 triton_windows、xformers),后期可能需要手动修复。
3. 安装 wheel 包
打开命令行,使用 pip 安装下载的 wheel 文件:
pip install vllm-0.11.0+cu124-cp312-cp312-win_amd64.whl
(请替换为实际下载的 wheel 文件路径和文件名)

二、从源码构建安装(不推荐)
前置要求
- 安装 Visual Studio 2019 或更高版本(用于编译环境)。
- 安装 CUDA 并配置环境变量(如
CUDA_ROOT、CUDA_HOME或CUDA_PATH)。
步骤
1. 安装依赖并构建
# 安装指定版本的 PyTorch(以 CUDA 12.6 为例,需与你的 CUDA 版本匹配)
pip install torch==2.7.1+cu126 torchaudio==2.7.1+cu126 torchvision==0.22.1+cu126 --index-url https://download.pytorch.org/whl/cu126
python use_existing_torch.py
pip install -r requirements/build.txt
pip install -r requirements/windows.txt
pip install . --no-build-isolation



