Faster-Whisper 笔记本 CPU 环境模型模式选择指南

CPU 环境下使用 Faster-Whisper 并开启 int8 量化，这几个模型模式（tiny、base、distil-whisper）的主要区别在于识别准确率（WER）、运行速度（RTF）以及对上下文的理解能力。

在 CPU + int8 模式下，你的瓶颈主要在于计算速度和内存带宽。以下是详细的对比分析和建议：

模型模式	参数量	速度 (CPU int8)	准确率	核心优势	适用场景
Tiny	~39M	🚀 极快	⭐ 基础	资源占用极低，响应最快	简单的语音指令、极低延迟需求的实时字幕
Base	~74M	⚡ 快	⭐⭐ 良好	速度与准确率的平衡点	日常会议记录、清晰的播客转录
Distil-Whisper	~756M	🐢 较慢	⭐⭐⭐⭐ 优秀	接近 Large 模型的准确率，抗噪性强	复杂口音、背景噪音大、专业术语较多的场景

特别说明：虽然你提到了 distil-whisper，但要注意它通常指的是 distil-large-v2 或 v3。这是一个通过'知识蒸馏'技术从庞大的 Large 模型压缩而来的版本。
特点：它的准确率非常惊人，甚至接近原版的 Large 模型，抗噪能力极强，能识别复杂的医学术语或口音。
CPU 风险：这是最大的坑。 虽然它比原版 Large 快 6 倍，但它的参数量（约 756M）远大于 Tiny 和 Base。
- 在 CPU 模式下，运行 Distil-large 可能会非常慢（甚至达不到实时转录的速度），且内存占用会显著上升（可能超过 2-3GB）。

更多推荐文章