Buzz 离线语音转文字工具：基于 Whisper 的本地部署指南

Buzz 是一款基于 Python 和 Whisper 模型的离线语音转文字工具，支持在本地计算机上安全处理音频转录与翻译任务。软件提供 Windows 安装包，支持多种 Whisper 模型切换，用户可根据硬件性能在速度与精度间取得平衡。对于无显卡环境，Small 及以上模型能提供更准确的识别结果，而 Tiny 模型则适合快速预览。通过手动配置模型路径或自动下载，即可实现完整的本地化工作流，无需依赖云端服务。

dehua dong发布于 2026/3/30更新于 2026/7/1734 浏览

简介

Buzz 是一款基于 Python 开发的开源工具，利用 OpenAI 的 Whisper 模型，支持在本地计算机上离线完成音频转录和翻译。无需联网即可处理敏感数据，适合对隐私要求较高的场景。

核心功能

主要适用于歌曲歌词提取、音视频字幕生成等场景。界面直观，操作简便。

下载与安装

软件提供 Windows 可执行文件，直接运行安装程序即可完成部署。官方源码托管于 GitHub，建议优先从官方仓库获取最新版本。

GitHub Release v1.2.0

界面概览

启动后主界面清晰展示了导入、转换及导出选项。

文章配图

模型支持

内置多种 Whisper 模型，可根据硬件性能选择不同精度。

文章配图

模型路径配置

若未自动下载模型，可将模型文件手动放置至缓存目录：

C:\Users\用户名\AppData\Local\Buzz\Buzz\Cache\models\whisper

性能表现参考

在实际测试中（CPU i5-12400，无独立显卡），处理 25-30 分钟语音时：

最小模型（Tiny）识别速度最快，但错别字较多，需人工校对。
Small 及以上模型识别质量显著提升，准确率优秀。

具体效果取决于本地硬件配置，建议根据实际需求权衡速度与精度。

Buzz 离线语音转文字工具：基于 Whisper 的本地部署指南

简介