Windows 环境下 faster-whisper 部署:CUDA 加速与 PyAV 依赖配置
前言:为什么选择 faster-whisper?
作为 OpenAI Whisper 的优化版本,faster-whisper 借助 CTranslate2 实现了 2-4 倍的速度提升,同时降低了 40% 的内存占用。本指南专为 Windows 用户打造,从 CUDA 环境配置到 PyAV 依赖解决,全程实操,帮你在 15 分钟内搭建生产级语音转写系统。
一、环境准备:硬件与系统要求
1.1 硬件要求
| 组件 | 最低配置 | 推荐配置 |
|---|---|---|
| GPU | NVIDIA GTX 1050Ti (4GB) | NVIDIA RTX 3060 (6GB) |
| CPU | Intel i5-8 代 | Intel i7-12 代/Ryzen 7 |
| 内存 | 8GB | 16GB |
| 存储 | 10GB 空闲空间 | SSD 20GB 空闲空间 |
1.2 系统要求
- Windows 10/11 64 位专业版/企业版
- 已安装 Python 3.8-3.11(建议 3.10 版本)
- 管理员权限(用于驱动安装)
二、CUDA 环境配置:Windows 专属方案
2.1 CUDA Toolkit 安装
faster-whisper 最新版本仅支持 CUDA 12,需严格按照以下步骤操作:
- 安装选项选择'自定义',确保勾选:
- CUDA Toolkit(必选)
- cuBLAS(必选)
- 仅安装运行时(取消勾选 Visual Studio Integration)
验证安装:
nvcc -V # 应显示 V12.0.0
下载 CUDA 12.0.0 官方安装包:
# 使用 winget 快速安装(推荐)
winget install --id NVIDIA.CUDAToolkit.12.0
手动下载地址:https://developer.nvidia.com/cuda-12.0.0-download-archive
2.2 cuDNN 配置
- 下载 cuDNN 8.9.0 for CUDA 12:
- 访问 https://developer.nvidia.com/cudnn(需注册 NVIDIA 账号)
- 选择"cuDNN v8.9.0 (November 28th, 2022), for CUDA 12.x"
解压后复制文件到 CUDA 目录:
# 假设 CUDA 安装在默认路径
xcopy cudnn-*-windows-x64-v8.9.0.*\cuda\bin\* "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.0\bin\" /Y
xcopy cudnn-*-windows-x64-v8.9.0.*\cuda\include\* "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.0\include\" /Y
xcopy cudnn-*-windows-x64-v8.9.0.*\cuda\lib\x64\* "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.0\lib\x64\" /Y

