Windows 上安装 vLLM
在 Windows 上安装 vLLM 有两种方式,分别是通过已发布的 wheel 包安装和从源码构建安装。
Windows 系统安装 vLLM 支持通过已发布的 wheel 包或源码构建两种方式。推荐使用 wheel 包,需确认 Python、PyTorch 及 CUDA 版本兼容性。源码构建需 Visual Studio 环境、CUDA 配置及特定环境变量,编译耗时较长且 Flash Attention v3 默认禁用。安装过程中需注意依赖冲突及路径设置问题。

在 Windows 上安装 vLLM 有两种方式,分别是通过已发布的 wheel 包安装和从源码构建安装。
版本信息: vllm-0.11.0+cu124-cp312-cp312-win_amd64.whl
安装 wheel 包 打开命令行,使用 pip 安装下载的 wheel 文件:
pip install vllm-0.11.0+cu124-cp312-cp312-win_amd64.whl
(注意替换为实际下载的 wheel 文件路径和文件名)
CUDA_ROOT、CUDA_HOME 或 CUDA_PATH,确保系统能识别 CUDA 路径)。安装依赖并构建
# 安装指定版本的 PyTorch(以 CUDA 12.6 为例,需与你的 CUDA 版本匹配)
pip install torch==2.3.1+cu126 torchaudio==2.3.1+cu126 torchvision==0.18.1+cu126 --index-url https://download.pytorch.org/whl/cu126
# 若已安装兼容的 PyTorch,可运行以下脚本复用现有环境
python use_existing_torch.py
# 安装构建依赖
pip install -r requirements/build.txt
pip install -r requirements/windows.txt
# 构建并安装 vLLM
pip install . --no-build-isolation
设置环境变量 必要的环境变量配置:
set DISTUTILS_USE_SDK=1
set VLLM_TARGET_DEVICE=cuda
set MAX_JOBS=10
并行编译的 CPU 线程数可根据实际情况调整。
(可选)如需启用 cuDNN、cuSPARSELt 等功能,需额外设置对应路径:
# 启用 cuDNN(替换为实际安装路径)
set USE_CUDNN=1
set CUDNN_LIBRARY_PATH=PATH_TO_CUDNN_INSTALL_DIR\lib\CUDNN_CUDA_VERSION\x64
set CUDNN_INCLUDE_PATH=PATH_TO_CUDNN_INSTALL_DIR\include\CUDNN_CUDA_VERSION
# 启用 cuSPARSELt(替换为实际安装路径)
set USE_CUSPARSELT=1
set CUSPARSELT_INCLUDE_PATH=PATH_TO_CUSPARSELT_INSTALL_DIR\include
set CUSPARSELT_LIBRARY_PATH=PATH_TO_CUSPARSELT_INSTALL_DIR\lib
配置 Visual Studio 编译环境
运行 Visual Studio 的 vcvarsall.bat 以初始化 x64 编译环境(替换为你的 VS 安装路径):
VISUAL_STUDIO_INSTALL_PATH\VC\Auxiliary\Build\vcvarsall.bat x64
打开命令行并克隆仓库
git clone --single-branch --branch vllm-for-windows https://github.com/SystemPanic/vllm-windows.git
cd vllm-windows
set VLLM_FORCE_FA3_WINDOWS_BUILD=1。PATH_TO_CUDNN_INSTALL_DIR)替换为实际安装路径。
微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online