简介
Buzz 是一款基于 Python 开发的开源工具,利用 OpenAI 的 Whisper 模型,支持在本地计算机上离线完成音频转录和翻译。无需联网即可处理敏感数据,适合对隐私要求较高的场景。
核心功能
主要适用于歌曲歌词提取、音视频字幕生成等场景。界面直观,操作简便。
下载与安装
软件提供 Windows 可执行文件,直接运行安装程序即可完成部署。官方源码托管于 GitHub,建议优先从官方仓库获取最新版本。
界面概览
启动后主界面清晰展示了导入、转换及导出选项。

模型支持
内置多种 Whisper 模型,可根据硬件性能选择不同精度。

模型路径配置
若未自动下载模型,可将模型文件手动放置至缓存目录:
C:\Users\用户名\AppData\Local\Buzz\Buzz\Cache\models\whisper
性能表现参考
在实际测试中(CPU i5-12400,无独立显卡),处理 25-30 分钟语音时:
- 最小模型(Tiny)识别速度最快,但错别字较多,需人工校对。
- Small 及以上模型识别质量显著提升,准确率优秀。
具体效果取决于本地硬件配置,建议根据实际需求权衡速度与精度。


