【笔记】在 Windows 上安装 Python-vLLM

【笔记】在 Windows 上安装 Python-vLLM
SystemPanic/vllm-windows:用于 LLM(Windows 构建和内核)的高吞吐量和内存效率推理和服务引擎

在 Windows 上安装 vLLM 有两种方式,分别是通过已发布的 wheel 包安装和从源码构建安装,具体步骤如下:



一、通过现有发布的 wheel 包安装(推荐)

发布 v0.11.0 ·SystemPanic/vllm-windows
vllm-0.11.0+cu124-cp312-cp312-win_amd64.whl
  1. 确认版本兼容性
    确保你的 Python、PyTorch 和 CUDA 版本与 wheel 包要求一致(版本信息会在发布版本中注明)。
  2. 下载 wheel 包
    从 最新发布页面 下载作者提供的版本(经测试:torch 和 CUDA 版本高于发布版,也能安装成功,但安装过程中会大量拉取安装其他依赖,可能会导致部分依赖被安装成与环境中其他库相冲突的版本,如 triton_windows、xformers 等,后期可能需要手动修复冲突)。

安装 wheel 包
打开命令行,使用 pip 安装下载的 wheel 文件:

pip install vllm-0.11.0+cu124-cp312-cp312-win_amd64.whl 

(注意替换为实际下载的 wheel 文件路径和文件名)



二、从源码构建安装(不推荐)

前置要求
  • 安装 Visual Studio 2019 或更高版本(需用于编译环境)。
  • 安装 CUDA 并配置环境变量(如 CUDA_ROOTCUDA_HOME 或 CUDA_PATH,确保系统能识别 CUDA 路径)。
步骤

安装依赖并构建

# 安装指定版本的 PyTorch(以 CUDA 12.6 为例,需与你的 CUDA 版本匹配) pip install torch==2.7.1+cu126 torchaudio==2.7.1+cu126 torchvision==0.22.1+cu126 --index-url https://download.pytorch.org/whl/cu126 # 若已安装兼容的 PyTorch,可运行以下脚本复用现有环境 python use_existing_torch.py # 安装构建依赖 pip install -r requirements/build.txt pip install -r requirements/windows.txt # 构建并安装 vLLM pip install . --no-build-isolation 

设置环境变量
必要的环境变量配置:

set DISTUTILS_USE_SDK=1 set VLLM_TARGET_DEVICE=cuda set MAX_JOBS=10 # 并行编译的 CPU 线程数,可根据实际情况调整 

(可选)如需启用 cuDNN、cuSPARSELt 等功能,需额外设置对应路径:

# 启用 cuDNN(替换为实际安装路径) set USE_CUDNN=1 set CUDNN_LIBRARY_PATH=PATH_TO_CUDNN_INSTALL_DIR\lib\CUDNN_CUDA_VERSION\x64 set CUDNN_INCLUDE_PATH=PATH_TO_CUDNN_INSTALL_DIR\include\CUDNN_CUDA_VERSION # 启用 cuSPARSELt(替换为实际安装路径) set USE_CUSPARSELT=1 set CUSPARSELT_INCLUDE_PATH=PATH_TO_CUSPARSELT_INSTALL_DIR\include set CUSPARSELT_LIBRARY_PATH=PATH_TO_CUSPARSELT_INSTALL_DIR\lib 

配置 Visual Studio 编译环境
运行 Visual Studio 的 vcvarsall.bat 以初始化 x64 编译环境(替换为你的 VS 安装路径):

VISUAL_STUDIO_INSTALL_PATH\VC\Auxiliary\Build\vcvarsall.bat x64 

打开命令行并克隆仓库

# 克隆 vllm-windows 仓库(指定分支) git clone --single-branch --branch vllm-for-windows https://github.com/SystemPanic/vllm-windows.git cd vllm-windows 

注意事项

  • 从源码构建时,Flash Attention v3 默认在 Windows 上禁用(因编译时间过长),如需强制启用,可设置环境变量 set VLLM_FORCE_FA3_WINDOWS_BUILD=1
  • 确保所有路径中的占位符(如 PATH_TO_CUDNN_INSTALL_DIR)替换为实际安装路径。
  • 若遇到编译或安装错误,建议检查依赖版本兼容性,并参考官方仓库的 issue 或文档进一步排查。

Read more

Flutter 三方库 music_notes 跨栈极客音乐教学底层核心算法鸿蒙化适配解析:高保真重组异度乐理参数体系精准切割动态音程和弦算子推进数字化编曲演进-适配鸿蒙 HarmonyOS ohos

Flutter 三方库 music_notes 跨栈极客音乐教学底层核心算法鸿蒙化适配解析:高保真重组异度乐理参数体系精准切割动态音程和弦算子推进数字化编曲演进-适配鸿蒙 HarmonyOS ohos

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 music_notes 跨栈极客音乐教学底层核心算法鸿蒙化适配解析:高保真重组异度乐理参数体系精准切割动态音程和弦算子推进数字化编曲演进大盘 在鸿蒙平台的数字音乐创作、智慧钢琴教学或音频编辑工具的开发中,如何通过代码精确表达音高(Pitch)、调性(Key)与和弦(Chord)逻辑?music_notes 库是一套专为乐理计算设计的 Dart 核心工具库。本文将详解该库在 OpenHarmony 上的适配要点。 前言 什么是 music_notes?它不仅能简单地表示音符。还内置了复杂的半音/全音步长运算、调号(Key Signatures)转换以及音程(Intervals)关系判定。在鸿蒙操作系统强调的“全场景智慧办公”和“极致影音娱乐”背景下,利用 music_notes 库可以确保你的应用在面对复杂的乐谱解析、

By Ne0inhk
【开源工具】深度解析:Python+PyQt5打造微信多开神器 - 原理剖析与完整实现

【开源工具】深度解析:Python+PyQt5打造微信多开神器 - 原理剖析与完整实现

🚀【开源工具】深度解析:Python+PyQt5打造微信多开神器 - 原理剖析与完整实现 🌈 个人主页:创客白泽 - ZEEKLOG博客 🔥 系列专栏:🐍《Python开源项目实战》 💡 热爱不止于代码,热情源自每一个灵感闪现的夜晚。愿以开源之火,点亮前行之路。 👍 如果觉得这篇文章有帮助,欢迎您一键三连,分享给更多人哦 📖 前言 微信作为国民级IM工具,但官方始终未提供多开功能。本文将深入讲解如何利用Python+PyQt5开发跨平台微信多开助手,突破官方限制。不同于网上简单的多开脚本,本项目实现了: * 自动化路径探测 * 可视化操作界面 * 多模式多开机制 * 完整的异常处理体系 🎯 一、功能全景 1.1 核心功能矩阵 功能模块技术实现亮点智能路径探测注册表查询+全盘扫描支持99%的安装场景可视化交互PyQt5自定义UI组件媲美原生应用的体验多开引擎子进程管理+沙盒隔离支持三种多开模式配置持久化QSettings序列化自动记忆用户偏好 1.2 技术栈深度 图形界面PyQt5多线程搜索跨进程通信注册表操作子进程管理

By Ne0inhk

FastAPI Admin轻量级企业级管理面板解决方案:零门槛构建Python后台系统

FastAPI Admin轻量级企业级管理面板解决方案:零门槛构建Python后台系统 【免费下载链接】fastapi-adminA fast admin dashboard based on FastAPI and TortoiseORM with tabler ui, inspired by Django admin 项目地址: https://gitcode.com/gh_mirrors/fa/fastapi-admin FastAPI Admin是基于FastAPI框架和TortoiseORM打造的轻量级企业级管理面板解决方案,为Python后台系统提供高效的数据管理能力。作为一款零门槛的管理系统,它结合现代Web技术最佳实践,帮助开发者快速搭建功能完善的后台管理平台,显著降低企业级应用的开发成本与部署难度。 FastAPI Admin核心优势解析:为何选择这款管理面板 在众多管理系统解决方案中,FastAPI Admin凭借其独特优势脱颖而出。首先,它基于FastAPI框架构建,继承了异步性能优势,处理高并发请求时表现卓越。其次,采用TortoiseORM作为数据访

By Ne0inhk
如何在 Mac 上安装 Python

如何在 Mac 上安装 Python

所有最新的 MacOS(从 macOS 12.3 开始)都预装了 Python 版本(通常是 Python 2.x),但它已经过时并且不再受支持。要充分利用 Python 的功能,您需要安装最新版本的 Python。         本文提供了分步教程,展示了在 macOS(MacBook 旧版本和新版本,如 M1、M2、M3 或 M4)上安装和更新 Python 的所有有效方法,从检查预安装版本到下载和更新最新的 Python 并设置基本工具(如IDE和包管理器),本指南将帮助您轻松地在任何 MacBook 设备上安装 Python。 先决条件 正在运行 MacOS 的笔记本电脑。 访问 Macbook 管理权限或密码。 如何在

By Ne0inhk