Whisper v0.2 本地语音转文字工具安装与使用指南
Whisper v0.2 是一款基于 Faster Whisper 模型优化的免费开源本地语音转文字工具。它在海量音频数据集上训练完成,支持多语言识别、翻译及语言检测。即便在普通 CPU 设备上,也能实现高效、精准的转换,无需依赖高性能硬件。
软件下载
获取安装包:Whisper 语音转文字工具安装包
安装与启动
解压下载好的压缩包到指定目录。找到主程序(.exe),右键选择以管理员身份运行以确保正常启动。若需后续快速打开,可右键主程序选择发送到→桌面快捷方式。

核心参数设置
初次使用建议关注以下关键配置,这直接影响识别速度与稳定性。
模型选择
默认集成 medium 模型,日常使用无需额外下载。如需更高精度(large)或更快速度(small),可在控制台查看下载进度,完成后即可切换。
GPU 选项设置
若电脑配备支持 CUDA 的独立显卡,可选择 GPU 模式加速;若无独显或显卡不支持 CUDA,务必保持 CPU 模式。强行开启 GPU 可能导致程序崩溃。
推理精度
普通 CPU 用户推荐 int8 精度,大幅提升速度且保证准确率;使用 large 模型时,建议设为 float32 以避免精度误差。

操作流程
- 导入音频:点击选择文件,支持 wav、mp3 格式。
- 开始识别:确认参数无误后点击开始识别。
- 保存结果:识别完成后点击保存结果,选择路径将文字保存为 txt 文件。



