【笔记】在 Windows 上安装 Python-vLLM

【笔记】在 Windows 上安装 Python-vLLM
SystemPanic/vllm-windows:用于 LLM(Windows 构建和内核)的高吞吐量和内存效率推理和服务引擎

在 Windows 上安装 vLLM 有两种方式,分别是通过已发布的 wheel 包安装和从源码构建安装,具体步骤如下:



一、通过现有发布的 wheel 包安装(推荐)

发布 v0.11.0 ·SystemPanic/vllm-windows
vllm-0.11.0+cu124-cp312-cp312-win_amd64.whl
  1. 确认版本兼容性
    确保你的 Python、PyTorch 和 CUDA 版本与 wheel 包要求一致(版本信息会在发布版本中注明)。
  2. 下载 wheel 包
    从 最新发布页面 下载作者提供的版本(经测试:torch 和 CUDA 版本高于发布版,也能安装成功,但安装过程中会大量拉取安装其他依赖,可能会导致部分依赖被安装成与环境中其他库相冲突的版本,如 triton_windows、xformers 等,后期可能需要手动修复冲突)。

安装 wheel 包
打开命令行,使用 pip 安装下载的 wheel 文件:

pip install vllm-0.11.0+cu124-cp312-cp312-win_amd64.whl 

(注意替换为实际下载的 wheel 文件路径和文件名)



二、从源码构建安装(不推荐)

前置要求
  • 安装 Visual Studio 2019 或更高版本(需用于编译环境)。
  • 安装 CUDA 并配置环境变量(如 CUDA_ROOTCUDA_HOME 或 CUDA_PATH,确保系统能识别 CUDA 路径)。
步骤

安装依赖并构建

# 安装指定版本的 PyTorch(以 CUDA 12.6 为例,需与你的 CUDA 版本匹配) pip install torch==2.7.1+cu126 torchaudio==2.7.1+cu126 torchvision==0.22.1+cu126 --index-url https://download.pytorch.org/whl/cu126 # 若已安装兼容的 PyTorch,可运行以下脚本复用现有环境 python use_existing_torch.py # 安装构建依赖 pip install -r requirements/build.txt pip install -r requirements/windows.txt # 构建并安装 vLLM pip install . --no-build-isolation 

设置环境变量
必要的环境变量配置:

set DISTUTILS_USE_SDK=1 set VLLM_TARGET_DEVICE=cuda set MAX_JOBS=10 # 并行编译的 CPU 线程数,可根据实际情况调整 

(可选)如需启用 cuDNN、cuSPARSELt 等功能,需额外设置对应路径:

# 启用 cuDNN(替换为实际安装路径) set USE_CUDNN=1 set CUDNN_LIBRARY_PATH=PATH_TO_CUDNN_INSTALL_DIR\lib\CUDNN_CUDA_VERSION\x64 set CUDNN_INCLUDE_PATH=PATH_TO_CUDNN_INSTALL_DIR\include\CUDNN_CUDA_VERSION # 启用 cuSPARSELt(替换为实际安装路径) set USE_CUSPARSELT=1 set CUSPARSELT_INCLUDE_PATH=PATH_TO_CUSPARSELT_INSTALL_DIR\include set CUSPARSELT_LIBRARY_PATH=PATH_TO_CUSPARSELT_INSTALL_DIR\lib 

配置 Visual Studio 编译环境
运行 Visual Studio 的 vcvarsall.bat 以初始化 x64 编译环境(替换为你的 VS 安装路径):

VISUAL_STUDIO_INSTALL_PATH\VC\Auxiliary\Build\vcvarsall.bat x64 

打开命令行并克隆仓库

# 克隆 vllm-windows 仓库(指定分支) git clone --single-branch --branch vllm-for-windows https://github.com/SystemPanic/vllm-windows.git cd vllm-windows 

注意事项

  • 从源码构建时,Flash Attention v3 默认在 Windows 上禁用(因编译时间过长),如需强制启用,可设置环境变量 set VLLM_FORCE_FA3_WINDOWS_BUILD=1
  • 确保所有路径中的占位符(如 PATH_TO_CUDNN_INSTALL_DIR)替换为实际安装路径。
  • 若遇到编译或安装错误,建议检查依赖版本兼容性,并参考官方仓库的 issue 或文档进一步排查。

Read more

Python大数据毕设选题:基于Hadoop+Django肥胖风险分析与可视化系统详解 毕业设计 选题推荐 毕设选题 数据分析 机器学习 数据挖掘

Python大数据毕设选题:基于Hadoop+Django肥胖风险分析与可视化系统详解 毕业设计 选题推荐 毕设选题 数据分析 机器学习 数据挖掘

✍✍计算机编程指导师 ⭐⭐个人介绍:自己非常喜欢研究技术问题!专业做Java、Python、小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目:有源码或者技术上的问题欢迎在评论区一起讨论交流! ⚡⚡如果你遇到具体的技术问题或计算机毕设方面需求可以在主页上详细资料里↑↑联系我~~ Java实战 | SpringBoot/SSM Python实战项目 | Django 微信小程序/安卓实战项目 大数据实战项目 ⚡⚡获取源码主页–> 计算机编程指导师 ⚡⚡文末获取源码 温馨提示:文末有ZEEKLOG平台官方免费提供的博客联系方式的名片! 温馨提示:文末有ZEEKLOG平台官方免费提供的博客联系方式的名片! 温馨提示:文末有ZEEKLOG平台官方免费提供的博客联系方式的名片! 肥胖风险分析与可视化系统-简介 本系统“基于Hadoop+Django的肥胖风险分析与可视化系统”旨在构建一个完整的大数据分析与Web应用流程。系统底层采用Hadoop分布式文件系统(HDFS)作为海量肥胖相关数据的存储基石,确保数据的高容错性和高吞吐量。核心计算引擎则选用Apache

By Ne0inhk
Python 绘制动态跳动爱心|情人节专属浪漫代码,新手零基础也能上手

Python 绘制动态跳动爱心|情人节专属浪漫代码,新手零基础也能上手

马上就是情人节,程序员的浪漫从一行行代码开始!今天分享一款纯 Python 内置库实现的动态跳动爱心,无需复杂第三方依赖,黑色背景搭配粒子化爱心,自带自然的跳动节奏和柔和光晕,既适合送给心仪的人制造惊喜,也能作为 Python 基础练手案例。本文全程保姆级文本解析 + 代码注释双保障,从环境搭建到代码逻辑逐字拆解,纯新手也能跟着一步步实现,轻松拿捏编程浪漫~ 这是最近粉丝私信求表白代码的聊天记录 —— 情人节 / 过年想给心仪的人制造浪漫,用代码做一份专属爱心礼物再合适不过,安排! 一、效果预览 运行代码后会直接弹出640×480的独立图形窗口,黑色背景搭配粒子化粉色爱心,实现沉浸式浪漫视觉效果,核心效果如下: 1. 爱心以自然的周期性节奏跳动,完成“收缩-扩张-收缩”的循环,流畅无卡顿; 2. 爱心由大量细腻粒子构成,轮廓清晰、内部填充饱满,边缘带有轻微粒子扩散效果; 3. 爱心外围附带动态光晕,光晕的大小、粒子数量随爱心跳动节奏同步变化,氛围感拉满; 4. 全程动态渲染,对电脑性能无要求,低配设备也能流畅运行,关闭窗口即可停止程序。

By Ne0inhk
博主亲测!Python+IPIDEA 自动化高效采集音乐数据

博主亲测!Python+IPIDEA 自动化高效采集音乐数据

文章目录 * 一、前言 * 二、全面认识 * 2.1 初步认识 * 2.2 实际使用感受 * 三、手把手教你:从0到1的完整流程 * 四、实战体验 * 五、超多场景预设,助力解决难题 * 六、用后感受 一、前言 最近想做个某云音乐每日推荐歌单存档小工具 —— 每天自动获取推荐歌曲,存成 Excel 方便回顾。结果刚跑了 3 天,代码就报网络异常,手动访问发现被平台限制了:刷新 10 次有 8 次跳验证,根本拿不到数据。 我一开始没当回事,试了两种办法:先是用免费代理池,结果要么失效快,要么访问速度比蜗牛还慢,歌单同步成功率不到 30%;后来手动换手机热点,每天要切 3 次

By Ne0inhk

Python 爬虫实战:爬取音乐平台(网易云 / QQ 音乐)歌曲信息

前言 音乐平台汇聚了海量的歌曲资源,包含歌名、歌手、专辑、播放量、歌词等核心信息,这些数据在音乐趋势分析、个性化推荐研究、音乐版权管理等场景中具有重要价值。传统手动整理歌曲信息的方式效率极低,而基于 Python 的爬虫技术能够批量采集音乐平台的歌曲数据,大幅提升数据获取效率。本文以网易云音乐和 QQ 音乐两大主流平台为例,系统讲解歌曲信息爬取的技术方案、接口解析方法及数据结构化处理,为音乐数据分析师和开发者提供可落地的实战指南。 摘要 本文聚焦音乐平台歌曲信息的爬取实战,分别以网易云音乐网页版和QQ 音乐网页版为核心操作对象(可直接点击进入对应平台),从抓包分析接口、构造请求参数,到多维度歌曲信息提取、数据清洗与存储,完整实现歌名、歌手、专辑、播放量、时长等核心字段的采集。文中包含可直接运行的代码案例、接口参数说明表格及数据输出结果,兼顾技术深度与实操性,帮助读者掌握不同音乐平台歌曲数据爬虫开发的核心技术。 一、技术栈与原理概述 1.1 核心技术栈 < 技术 / 库功能说明

By Ne0inhk