简介
Buzz 是一款基于 Python 开发的本地语音转录工具,核心采用 OpenAI 的 Whisper 模型。它最大的特点是完全离线运行,无需联网即可完成音频或视频的文本转换与翻译。当前版本为 1.2.0,支持多种 Whisper 模型配置。
主要功能
除了基础的语音转文字,它还常用于歌曲歌词提取、会议录音整理等场景。界面简洁,操作逻辑符合直觉。
获取方式
推荐直接从官方仓库下载最新版,确保安全性与稳定性。
安装步骤
Windows 用户只需双击 exe 文件即可开始安装,过程非常简单,无需额外配置环境。
界面操作
启动后主界面清晰直观,加载模型后即可导入音频文件进行转换。软件支持实时预览和批量处理。

模型配置
如果软件未自动加载模型,可以手动将 Whisper 模型文件放入以下目录:
C:\Users\{用户名}\AppData\Local\Buzz\Buzz\Cache\models\whisper
放置到该位置后重启软件即可识别。
性能表现
在实际测试中(i5-12400 CPU,无独立显卡),使用最小模型时识别率尚可但错别字较多,需要人工校对。若选择 Small 或更大规模的模型,识别效果会有显著提升。具体表现取决于硬件配置和使用场景。



