Windows 环境下 vLLM 安装与构建指南

在 Windows 系统上部署 vLLM 引擎，目前主要有两种路径：使用预编译的 wheel 包直接安装，或者从源码进行构建。前者适合快速验证，后者则能提供更灵活的控制权。

一、通过 Wheel 包安装（推荐）

这种方式最便捷，但需要确保本地环境与发布包的版本要求匹配。

1. 确认版本兼容性

下载前请核对 Python、PyTorch 和 CUDA 的版本。发布页面通常会注明支持的版本范围。虽然有时高版本也能安装成功，但可能会拉取大量依赖，导致 triton_windows、xformers 等库与现有环境冲突，后期修复成本较高。

2. 下载并安装

前往 GitHub 发布页获取最新的 wheel 文件。以 v0.11.0 为例：

文章配图

在终端中执行 pip 安装命令，记得替换为实际的文件路径：

pip install vllm-0.11.0+cu124-cp312-cp312-win_amd64.whl

安装完成后，建议检查基础导入是否正常。

文章配图

二、从源码构建安装

如果你需要特定功能或想深入理解底层，可以选择源码构建。这通常比较耗时，且对开发环境有明确要求。

前置准备

Visual Studio：需安装 2019 或更高版本，用于 C++ 编译。
CUDA：安装对应版本的 CUDA Toolkit，并确保环境变量（如 CUDA_ROOT、CUDA_HOME）配置正确，让系统能识别路径。

构建步骤

1. 克隆仓库与初始化

首先克隆支持 Windows 的分支：

git clone --single-branch --branch vllm-for-windows https://github.com/SystemPanic/vllm-windows.git
cd vllm-windows

2. 安装依赖

根据你本地的 CUDA 版本安装对应的 PyTorch。例如 CUDA 12.6：

pip install torch==2.7.1+cu126 torchaudio==2.7.1+cu126 torchvision==0.22.1+cu126 --index-url https://download.pytorch.org/whl/cu126

如果环境中已有兼容的 PyTorch，可以运行脚本来复用：

python use_existing_torch.py

接着安装构建所需的依赖：

pip install -r requirements/build.txt
pip install -r requirements/windows.txt

Windows 环境下 vLLM 安装与构建指南

Windows 环境下 vLLM 安装与构建指南

一、通过 Wheel 包安装（推荐）

1. 确认版本兼容性

2. 下载并安装

二、从源码构建安装

前置准备

构建步骤

1. 克隆仓库与初始化

2. 安装依赖

更多推荐文章

相关免费在线工具

3. 设置编译环境

4. 开始构建

注意事项

更多推荐文章

相关免费在线工具

Windows 环境下 vLLM 安装与构建指南

Windows 环境下 vLLM 安装与构建指南

一、通过 Wheel 包安装（推荐）

1. 确认版本兼容性

2. 下载并安装

二、从源码构建安装

前置准备

构建步骤

1. 克隆仓库与初始化

2. 安装依赖

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 设置编译环境

4. 开始构建

注意事项

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具