Whisper 提供五种模型尺寸,选型时主要看精度要求和硬件限制。下表把参数量、内存需求和适用场景都列清楚了,直接用就行。
| 版本 | 参数量 | 内存需求 | 多语言 | 推荐场景 |
|---|---|---|---|---|
tiny | 39M | ~1GB | ✓ | 移动端/嵌入式设备 |
base | 74M | ~1.5GB | ✓ | 实时转录 |
small | 244M | ~2.5GB | ✓ | 日常办公场景 |
medium | 769M | ~5.5GB | ✓ | 专业音频处理 |
large-v2 | 1.5B | ~10.5GB | ✓ | 研究级高精度识别 |
目前官方还没发 2025 新版,关注 OpenAI 博客或 GitHub Release 就好。
模型格式怎么选
不同部署环境需要的格式不一样,开发时按场景取用:
- PyTorch(
.pt):最省事的格式。装好openai-whisper后首次调用会自动下载,默认从https://openaipublic.azureedge.net/main/whisper/models/{model_id}.pt拉取。 - TensorFlow(
.h5):一般用官方脚本把 PyTorch 权重转过去,或者直接在 Hugging Face Hub 搜别人转好的。 - ONNX(
.onnx):跨平台部署用得多,尤其是 WebAssembly 或移动端,配合 ONNX Runtime 示例仓库 做优化。
下载地址
命令行自动下载
最稳妥的方式,替换 <model_size> 为版本名就行:
whisper download <model_size>
手动下载直链
网络受限时直接用下面这些 PyTorch 文件链接:
| 版本 | PyTorch 直链 |
|---|---|
| tiny | https://openaipublic.azureedge.net/main/whisper/models/65147644a518d12f04e32d6f3b26facc3f8dd46e5390956a9424a650c0ce22b9/tiny.pt |

