简介
Buzz 是一款基于 Python 开发的离线语音转录与翻译工具,底层采用 OpenAI 的 Whisper 模型。它允许用户在个人计算机上完全离线处理音频数据,无需联网上传,非常适合注重隐私的场景。
应用场景
主要适用于歌曲歌词提取、会议录音转文字、视频字幕生成等需要本地化处理的音频分析任务。
下载安装
官方发布地址在 GitHub,建议优先从源头获取以确保版本安全。
Release v1.2.0 · chidiwilliams/buzz

Windows 用户下载对应的 exe 安装包后,双击即可直接安装,无需复杂配置。
软件使用
启动后主界面简洁直观,支持导入音频文件或录制输入。

模型支持
软件内置了多种 Whisper 模型供选择,不同模型在速度与精度之间有不同的权衡。

高级配置:手动管理模型
如果软件内未显示所需模型,或者需要加载自定义权重,可以手动将模型文件放入缓存目录。
默认路径如下(请将 **用户** 替换为实际用户名):
C:\Users\**用户**\AppData\Local\Buzz\Buzz\Cache\models\whisper
将下载的模型文件放置于此位置后重启软件即可生效。
性能表现参考
在实际测试中,硬件配置对推理速度影响明显。以 i5-12400 处理器且无独立显卡的环境为例:
- Tiny 模型:速度最快,但错别字较多,后续需要人工校对。
- Small 及以上模型:识别准确度显著提升,基本满足日常使用需求。
具体选择哪一档模型,建议根据电脑配置和对精度的要求灵活调整。


