核心版本选择
Whisper 提供五种规模版本,开发者需根据资源与精度需求权衡:
| 版本 | 参数量 | 内存需求 | 多语言 | 推荐场景 |
|---|---|---|---|---|
tiny | 39M | ~1GB | ✓ | 移动端/嵌入式设备 |
base | 74M | ~1.5GB | ✓ | 实时转录 |
small | 244M | ~2.5GB | ✓ | 日常办公场景 |
medium | 769M | ~5.5GB | ✓ | 专业音频处理 |
large-v2 | 1.5B | ~10.5GB | ✓ | 研究级高精度识别 |
注:目前官方尚未发布 2025 新版本,建议通过 OpenAI 博客或 GitHub Release 跟踪更新。
模型格式说明
不同开发环境对模型格式有特定要求,主流方案如下:
-
PyTorch 格式(
.pt)- 原生支持:安装
openai-whisper后自动加载 - 默认路径:
https://openaipublic.azureedge.net/main/whisper/models/{model_id}.pt
- 原生支持:安装
-
TensorFlow 格式(
.h5)- 转换工具:需使用官方脚本转换
- 托管平台:Hugging Face Hub 可搜索相关模型
-
ONNX 运行时格式(
.onnx)- 跨平台支持:适用于 WebAssembly 或移动端部署
- 优化工具链:参考 ONNX Runtime 示例仓库
一键下载导航
官方源直连(推荐)
使用命令行工具自动下载最稳妥,替换 <model_size> 为具体版本号即可:
whisper download <model_size>
手动下载地址
若网络受限,可直接复制以下链接获取对应版本的 PyTorch 文件:
| 版本 | PyTorch 直链 |
|---|---|
| tiny | https://openaipublic.azureedge.net/main/whisper/models/65147644a518d12f04e32d6f3b26facc3f8dd46e5390956a9424a650c0ce22b9/tiny.pt |
| base |

