Buzz 离线语音转文字工具介绍
Buzz 是一款基于 Python 开发的本地音频转录与翻译工具,底层采用 OpenAI 的 Whisper 模型。它支持在个人计算机上完全离线处理音频文件,无需联网即可提取歌词或视频字幕。
下载与安装
建议直接从官方仓库获取最新版本,以确保稳定性。
Windows 用户下载 exe 安装包后,双击运行即可完成安装,过程无需额外配置。
界面与功能概览
启动软件后,主界面布局直观,主要功能集中在左侧操作区。

支持多种 Whisper 模型加载,可根据硬件性能选择不同精度的模型。

模型路径配置
如果软件未自动识别模型,可手动将模型文件放置到缓存目录。默认路径如下:
C:\Users\你的用户名\AppData\Local\Buzz\Buzz\Cache\models\whisper
将下载的模型文件放入该文件夹后重启软件即可生效。
性能表现参考
实际体验中,硬件配置对识别速度和准确率影响明显。以 i5-12400 处理器且无独立显卡的环境为例:
- 最小模型:解析 25-30 分钟语音较快,但错别字较多,后续可能需要人工校对。
- Small 及以上模型:识别效果优秀,流畅度更佳,具体取决于电脑配置和场景需求。
对于追求效率的用户,建议根据硬件条件权衡模型大小。


