Whisper v0.2 本地语音转文字工具安装与使用指南

Whisper v0.2 是一款基于 Faster Whisper 模型优化的免费开源本地语音转文字工具。它在海量音频数据集上训练完成，支持多语言识别、翻译及语言检测。即便在普通 CPU 设备上，也能实现高效、精准的转换，无需依赖高性能硬件。

解压下载好的压缩包到指定目录。找到主程序（.exe），右键选择以管理员身份运行以确保正常启动。若需后续快速打开，可右键主程序选择发送到→桌面快捷方式。

Whisper 主程序启动

初次使用建议关注以下关键配置，这直接影响识别速度与稳定性。

默认集成 medium 模型，日常使用无需额外下载。如需更高精度（large）或更快速度（small），可在控制台查看下载进度，完成后即可切换。

若电脑配备支持 CUDA 的独立显卡，可选择 GPU 模式加速；若无独显或显卡不支持 CUDA，务必保持 CPU 模式。强行开启 GPU 可能导致程序崩溃。

普通 CPU 用户推荐 int8 精度，大幅提升速度且保证准确率；使用 large 模型时，建议设为 float32 以避免精度误差。

Whisper 参数设置界面

Whisper 文件选择界面 Whisper 保存结果界面

更多推荐文章