项目核心信息
| 项目信息 | 详细说明 |
|---|---|
| 项目地址 | chidiwilliams/buzz |
| 核心技术栈 | Python,基于 OpenAI Whisper 模型,支持 CUDA/Apple Silicon 硬件加速 |
| 核心定位 | 全平台离线语音转文字/翻译工具,本地处理无隐私泄露风险 |
| 核心功能 | 离线音频转写、实时麦克风转录、说话人识别、多语言翻译、多格式导出 |
| 支持平台 | Windows、macOS、Linux |
一、Buzz 概述
在处理会议录音、客户访谈时,语音转写工具的需求强烈。在线工具存在隐私泄露风险,且依赖网络;部分工具按分钟收费。Buzz 完全在本地运行,无需上传数据到云端,支持离线使用。基于 OpenAI 的 Whisper 模型,转写准确率较高,支持 90 多种语言。
二、核心功能
1. 纯离线运行,隐私安全
所有音频处理都在本地完成,不会经过任何云端服务器。处理完直接删除本地文件,隐私安全有保障。
2. 转写准确率高,噪音环境可用
基于 Whisper 模型,在安静办公室、有背景噪音或多人对话场景下,转写准确率较高。支持 90 多种语言,可直译外文。
3. 实时麦克风转录
选择'麦克风转录',能实时把会议对话转写成文字,支持自动区分说话人(需提前设置)。会后导出文本整理即可。
4. 多格式导出与硬件加速
支持导出 TXT、SRT、VTT 等多种格式。支持 CUDA(NVIDIA 显卡)和 Apple Silicon(M 系列芯片)加速,处理大文件速度快。
三、安装与使用指南
1. 各平台安装方法
Windows 用户
- 方式 1:直接下载安装包:访问项目页面下载最新版本的.exe 安装包,双击安装。
- 方式 2:命令行安装:打开 PowerShell,输入
winget install --id chidiwilliams.buzz。
macOS 用户
下载.dmg 安装包,打开后把 Buzz 拖到应用程序文件夹。M 系列芯片用户首次打开可能需要授权。
Linux 用户
通过 Flatpak 或 Snap 商店安装:
# Flatpak 安装
flatpak install flathub io.github.chidiwilliams.buzz
# Snap 安装
snap install buzz
开发者专用:Python 包安装
如需通过代码调用或自定义修改,可用 pip 安装:
# 先安装 FFmpeg
# Windows:下载 FFmpeg 解压后添加环境变量;macOS:brew install ffmpeg;Linux:sudo apt install ffmpeg
# 安装 Buzz 包
pip install buzz-captions
# 启动程序
buzz

