【笔记】在 Windows 上安装 Python-vLLM

【笔记】在 Windows 上安装 Python-vLLM
SystemPanic/vllm-windows:用于 LLM(Windows 构建和内核)的高吞吐量和内存效率推理和服务引擎

在 Windows 上安装 vLLM 有两种方式,分别是通过已发布的 wheel 包安装和从源码构建安装,具体步骤如下:



一、通过现有发布的 wheel 包安装(推荐)

发布 v0.11.0 ·SystemPanic/vllm-windows
vllm-0.11.0+cu124-cp312-cp312-win_amd64.whl
  1. 确认版本兼容性
    确保你的 Python、PyTorch 和 CUDA 版本与 wheel 包要求一致(版本信息会在发布版本中注明)。
  2. 下载 wheel 包
    从 最新发布页面 下载作者提供的版本(经测试:torch 和 CUDA 版本高于发布版,也能安装成功,但安装过程中会大量拉取安装其他依赖,可能会导致部分依赖被安装成与环境中其他库相冲突的版本,如 triton_windows、xformers 等,后期可能需要手动修复冲突)。

安装 wheel 包
打开命令行,使用 pip 安装下载的 wheel 文件:

pip install vllm-0.11.0+cu124-cp312-cp312-win_amd64.whl 

(注意替换为实际下载的 wheel 文件路径和文件名)



二、从源码构建安装(不推荐)

前置要求
  • 安装 Visual Studio 2019 或更高版本(需用于编译环境)。
  • 安装 CUDA 并配置环境变量(如 CUDA_ROOTCUDA_HOME 或 CUDA_PATH,确保系统能识别 CUDA 路径)。
步骤

安装依赖并构建

# 安装指定版本的 PyTorch(以 CUDA 12.6 为例,需与你的 CUDA 版本匹配) pip install torch==2.7.1+cu126 torchaudio==2.7.1+cu126 torchvision==0.22.1+cu126 --index-url https://download.pytorch.org/whl/cu126 # 若已安装兼容的 PyTorch,可运行以下脚本复用现有环境 python use_existing_torch.py # 安装构建依赖 pip install -r requirements/build.txt pip install -r requirements/windows.txt # 构建并安装 vLLM pip install . --no-build-isolation 

设置环境变量
必要的环境变量配置:

set DISTUTILS_USE_SDK=1 set VLLM_TARGET_DEVICE=cuda set MAX_JOBS=10 # 并行编译的 CPU 线程数,可根据实际情况调整 

(可选)如需启用 cuDNN、cuSPARSELt 等功能,需额外设置对应路径:

# 启用 cuDNN(替换为实际安装路径) set USE_CUDNN=1 set CUDNN_LIBRARY_PATH=PATH_TO_CUDNN_INSTALL_DIR\lib\CUDNN_CUDA_VERSION\x64 set CUDNN_INCLUDE_PATH=PATH_TO_CUDNN_INSTALL_DIR\include\CUDNN_CUDA_VERSION # 启用 cuSPARSELt(替换为实际安装路径) set USE_CUSPARSELT=1 set CUSPARSELT_INCLUDE_PATH=PATH_TO_CUSPARSELT_INSTALL_DIR\include set CUSPARSELT_LIBRARY_PATH=PATH_TO_CUSPARSELT_INSTALL_DIR\lib 

配置 Visual Studio 编译环境
运行 Visual Studio 的 vcvarsall.bat 以初始化 x64 编译环境(替换为你的 VS 安装路径):

VISUAL_STUDIO_INSTALL_PATH\VC\Auxiliary\Build\vcvarsall.bat x64 

打开命令行并克隆仓库

# 克隆 vllm-windows 仓库(指定分支) git clone --single-branch --branch vllm-for-windows https://github.com/SystemPanic/vllm-windows.git cd vllm-windows 

注意事项

  • 从源码构建时,Flash Attention v3 默认在 Windows 上禁用(因编译时间过长),如需强制启用,可设置环境变量 set VLLM_FORCE_FA3_WINDOWS_BUILD=1
  • 确保所有路径中的占位符(如 PATH_TO_CUDNN_INSTALL_DIR)替换为实际安装路径。
  • 若遇到编译或安装错误,建议检查依赖版本兼容性,并参考官方仓库的 issue 或文档进一步排查。

Read more

Python监控新范式:Logfire可观测性平台实战落地指南

Python监控新范式:Logfire可观测性平台实战落地指南 【免费下载链接】logfireUncomplicated Observability for Python and beyond! 🪵🔥 项目地址: https://gitcode.com/GitHub_Trending/lo/logfire 在现代Python应用开发中,性能瓶颈和异常问题往往隐藏在复杂的代码逻辑和分布式系统中,传统监控工具要么配置繁琐,要么无法深度适配Python生态。Logfire作为Pydantic团队打造的可观测性平台,以"Python原生"为核心优势,通过自动化追踪、SQL查询分析和直观可视化,为开发者提供从代码到生产环境的全链路监控能力。本文将系统介绍如何利用Logfire解决Python应用性能追踪难题,从价值定位到进阶配置,帮助团队快速落地可观测性实践。 价值定位:为什么Python应用需要专属可观测性平台? Python生态的独特性让通用监控工具常常显得力不从心——动态类型系统、异步编程模型和丰富的第三方库,都要求监控工具具备深度语言集成能力。Logfire基于OpenTe

By Ne0inhk
Python系列Bug修复|如何解决 pip install 安装报错 pyproject.toml 缺少 build-system.requires 问题

Python系列Bug修复|如何解决 pip install 安装报错 pyproject.toml 缺少 build-system.requires 问题

摘要 本文聚焦pip install安装Python包时出现的“pyproject.toml missing ‘build-system.requires’”(pyproject.toml 缺少 build-system.requires)报错,该问题核心是pip 按 PEP 621 规范解析pyproject.toml时,未找到build-system.requires配置块——该配置是现代Python包构建的核心,用于声明构建包所需的依赖(如setuptools、wheel),缺失会导致pip无法确定构建环境依赖,直接中断安装流程。文章从build-system.requires的作用原理出发,拆解报错根源(配置缺失、格式错误、pip版本过低、文件异常等),提供分场景的解决方案:补充标准配置块、修复配置格式、升级pip版本;同时覆盖Windows/Linux/macOS系统适配及PyCharm环境排障技巧,帮助开发者彻底解决该报错,同时给出规范pyproject.toml配置的预防策略。 文章目录 * 摘要 * 一、报错核心认知:不是文件缺失,

By Ne0inhk

深度解析孪生网络(Siamese Network):从原理、技巧到实战应用

深度解析孪生网络(Siamese Network):从原理、技巧到实战应用 在深度学习的版图里,孪生网络(Siamese Network) 是一种独特的存在。它不追求直接对目标进行分类,而是追求对目标之间“相似度”的极致衡量。这种架构在人脸识别(如手机刷脸解锁)、签名校验、文本语义匹配以及我们之前提到的 TSTD(时间序列异常检测)中都有着广泛的应用。 一、 核心概念:什么是孪生网络? 孪生网络,顾名思义,就像是一对双胞胎。它由**两个(或多个)结构完全相同、且共享权重(Shared Weights)**的子网络组成。 1.1 工作原理 当你输入两张图片 X1X_1X1 和 X2X_2X2 时,这对“双胞胎”子网络会分别将它们映射到高维特征空间,得到特征向量 G(

By Ne0inhk
tkinter,一个易用的 Python 库!

tkinter,一个易用的 Python 库!

一、库的简介:GUI编程的实际价值 在当今数字化时代,图形用户界面(GUI)已成为软件与用户交互的主要方式。无论是企业级应用、数据分析工具,还是日常办公软件,友好的可视化界面都极大地提升了用户体验和工作效率。Tkinter作为Python的标准GUI库,为开发者提供了一条快速构建桌面应用程序的捷径。 在实际生活中,Tkinter的应用无处不在:从简单的文件管理器、计算器、记事本,到复杂的数据可视化工具、自动化测试平台,乃至智能家居控制面板。例如,一家小型企业可以使用Tkinter快速开发内部库存管理系统,教师可以制作交互式教学工具,数据分析师可以构建数据探索仪表板。相比于Web应用,桌面应用具有更好的本地资源访问能力、更快的响应速度和离线使用优势。 Tkinter基于Tk GUI工具包,提供跨平台支持(Windows、macOS、Linux),无需额外安装,是Python标准库的一部分。虽然功能不像PyQt或wxPython那样丰富,但它的简单易用、轻量级特性和零依赖安装使其成为快速原型开发和小型应用的首选。 二、安装Tkinter Tkinter通常随Python标准库一

By Ne0inhk