Whisper 模型本地化部署指南
模型版本与下载
Whisper 提供了从 tiny 到 large-v2 的多种规模版本,可根据显存和精度需求选择。获取途径主要有两个:
-
GitHub 仓库 https://github.com/openai/whisper 这里包含最新代码、预训练权重和文档。
tiny.en/tinybase.en/basesmall.en/smallmedium.en/mediumlarge-v2(最新大模型)
-
Hugging Face 模型库 所有版本的下载路径统一为:
https://huggingface.co/openai/whisper-{version}/tree/main只需将
{version}替换为具体型号即可。
环境准备
硬件要求
- GPU 推荐:NVIDIA GTX 1080 或更高
- 显存占用:小模型建议 ≥ 2GB,大模型建议 ≥ 10GB
基础环境配置
建议使用 Python 3.8+ 并创建虚拟环境隔离依赖:
# 安装 Python 3.8 及 pip
sudo apt install python3.8 python3-pip
# 创建虚拟环境
python3 -m venv whisper-env
source whisper-env/bin/activate
离线依赖安装
如果是纯离线环境,需要先在一台联网设备上下载好所有 .whl 包,再迁移至目标机器。
在联网设备操作:
pip download -r requirements.txt --platform manylinux2014_x86_64 \
--only-binary=:all: --python-version 3.8
在离线设备安装:
pip install --no-index --find-links=/path/to/wheels -r requirements.txt
模型部署与验证
手动下载模型权重文件(.pt),保存至 ~/.cache/whisper/ 目录下。加载时直接指定模型名称即可。
import whisper
model = whisper.load_model("base")
result = model.transcribe("audio_sample.mp3")
print(result[])

