普通笔记本跑 Faster-Whisper：CPU 模式下模型选择指南

在 CPU 环境下使用 Faster-Whisper 并开启 int8 量化，不同模型模式（tiny、base、distil-whisper）的主要区别在于识别准确率（WER）、运行速度（RTF）以及对上下文的理解能力。

对于普通笔记本电脑而言，瓶颈通常在于计算速度和内存带宽。咱们直接看几个关键指标的区别，再决定怎么选。

核心区别概览

模型模式	参数量	速度 (CPU int8)	准确率	核心优势	适用场景
Tiny	~39M	🚀 极快	⭐ 基础	资源占用极低，响应最快	简单的语音指令、极低延迟需求的实时字幕
Base	~74M	⚡ 快	⭐⭐ 良好	速度与准确率的平衡点	日常会议记录、清晰的播客转录
Distil-Whisper	~756M	🐢 较慢	⭐⭐⭐⭐ 优秀	接近 Large 模型的准确率，抗噪性强	复杂口音、背景噪音大、专业术语较多的场景

详细模式解析

Tiny 模式：极致速度，资源敏感

这是最轻量级的模型。在 CPU 上使用 int8 量化后，它的推理速度非常快，几乎可以实现实时的流式转录（延迟 < 200ms）。

不过它的'智商'有限。对于发音不清、语速过快或背景嘈杂的音频，它的幻觉（胡乱识别）率较高，标点符号和断句能力也较弱。

在普通笔记本 CPU 上，它几乎不占内存（<500MB），且不会让电脑风扇狂转。如果你追求的是'能听就行'，选它没错。

Base 模式：均衡之选（推荐首选）

参数量约为 Tiny 的两倍，但带来的准确率提升通常比速度损失更划算。它在大多数清晰语音场景下的表现已经足够好。

相比 Tiny，它能更好地理解上下文，减少简单的同音字错误。在 int8 模式下，内存占用依然很低（约 300-400MB），速度依然流畅，是大多数笔记本用户的'甜点'选择。

Distil-Whisper (Distil-large-v2/v3)：降维打击

虽然你提到了 distil-whisper，但要注意它通常指的是 distil-large-v2 或 v3。这是一个通过'知识蒸馏'技术从庞大的 Large 模型压缩而来的版本。

它的准确率非常惊人，甚至接近原版的 Large 模型，抗噪能力极强，能识别复杂的医学术语或口音。

这里有个大坑需要注意： 虽然它比原版 Large 快 6 倍，但它的参数量（约 756M）远大于 Tiny 和 Base。

在 CPU 模式下，运行 Distil-large 可能会非常慢（甚至达不到实时转录的速度），且内存占用会显著上升（可能超过 2-3GB）。
除非你的笔记本 CPU 核心数较多（如 8 核以上）且你愿意牺牲实时性换取高准确率，否则在纯 CPU 环境下慎用 Distil-large。

什么是 `int8` 量化？

你提到的是关键配置。

普通笔记本跑 Faster-Whisper：CPU 模式下模型选择指南