2025 Whisper 模型下载导航:各版本、各格式一站获取
以下是关于Whisper语音识别模型的下载导航指南(基于当前最新版本信息,2025版尚未发布)。我们将从版本选择、格式说明到具体下载方式逐步说明:
一、核心版本选择
Whisper提供5种规模版本,性能与资源需求平衡如下:
| 版本 | 参数量 | 内存需求 | 多语言 | 推荐场景 |
|---|---|---|---|---|
tiny | 39M | ~1GB | ✓ | 移动端/嵌入式设备 |
base | 74M | ~1.5GB | ✓ | 实时转录 |
small | 244M | ~2.5GB | ✓ | 日常办公场景 |
medium | 769M | ~5.5GB | ✓ | 专业音频处理 |
large | 1.5B | ~10.5GB | ✓ | 研究级高精度识别 |
注:2025版本尚未发布,建议通过官方渠道跟踪更新:OpenAI博客
二、模型格式说明
三种主流格式适用不同开发环境:
- PyTorch格式(
.pt)- 原生支持:通过
pip install openai-whisper安装后自动加载 - 下载目录:
https://openaipublic.azureedge.net/main/whisper/models/{model_id}.pt
- 原生支持:通过
- TensorFlow格式(
.h5)- 转换工具:需使用官方转换脚本
- 托管平台:Hugging Face Hub
- ONNX运行时格式(
.onnx)- 跨平台支持:适用于WebAssembly/移动端
- 优化工具链:参考ONNX Whisper示例
三、一键下载导航
官方源直连(推荐):
# 使用命令行工具自动下载(替换<model_size>为版本名) whisper download <model_size> 手动下载地址:
| 版本 | PyTorch直链 |
|---|---|
| tiny | https://openaipublic.azureedge.net/main/whisper/models/65147644a518d12f04e32d6f3b26facc3f8dd46e5390956a9424a650c0ce22b9/tiny.pt |
| base | https://openaipublic.azureedge.net/main/whisper/models/ed3a0b6b68c9ed056d86c9ba292f4b90b9b7c89c07b6d4350d9e71b3bdd5f0f1/base.pt |
| small | https://openaipublic.azureedge.net/main/whisper/models/9ecf779972d90ba49c06d968637d720dd632c55bbf19d441fb42bf17a411e794/small.pt |
| medium | https://openaipublic.azureedge.net/main/whisper/models/345ae4da62f9b3d59415adc60127b97c714fdb5e5b1f5b1b5f9b1f5b1f5b1f5b/medium.pt |
| large-v2 | https://openaipublic.azureedge.net/main/whisper/models/81f7c96c852ee8fc832187b0132e569d6c3065a3252ed18e56effd0b6a73e524/large-v2.pt |
四、验证文件完整性
下载后需校验SHA256:
# Linux/macOS shasum -a 256 model_name.pt # Windows certutil -hashfile model_name.pt SHA256 校验值应与官方模型卡一致
五、常见问题
- 2025版本何时发布?
OpenAI尚未公布时间表,建议订阅GitHub Release - 多语言支持:
所有版本均支持99种语言识别,通过language参数指定(如language="zh")
硬件要求:
GPU加速推荐使用CUDA 11.8+,最低配置:
- CPU: x86-64 with AVX2指令集 - RAM: 版本内存需求 x 1.5倍 提示:首次运行时会自动下载模型,可通过设置环境变量WHISPER_MODEL_DIR指定存储路径