快速开始体验
安装 WhisperLive 非常简单,只需几个步骤即可开始您的实时语音转文本之旅:
# 安装必要的依赖
bash scripts/setup.sh
# 通过 pip 安装 WhisperLive
pip install whisper-live
核心功能特性
多后端支持架构
WhisperLive 支持三种高性能后端引擎,满足不同硬件环境需求:
- Faster Whisper - CPU 优化版本,适合大多数标准配置
- TensorRT - NVIDIA GPU 加速,提供极致性能体验
- OpenVINO - Intel 硬件专属优化,支持 CPU 和 GPU
多样化输入源支持
- 🎤 麦克风实时输入转录
- 📁 音频文件批量处理
- 🌐 RTSP/HLS 流媒体实时转写
- 🌍 多语言自动识别与翻译
服务器部署指南
启动 WhisperLive 服务器非常简单,根据您的硬件配置选择合适后端:
# 使用 Faster Whisper 后端(CPU 优化)
python3 run_server.py --port 9090 --backend faster_whisper
# 使用 TensorRT 后端(GPU 加速)
python3 run_server.py -p 9090 -b tensorrt -trt /path/to/TensorRT-engine
客户端使用示例
WhisperLive 提供了简洁易用的客户端 API:
from whisper_live.client import TranscriptionClient
# 创建客户端实例
client = TranscriptionClient("localhost", 9090, lang="zh", model="small")
# 转录音频文件
client("assets/jfk.flac")
# 实时麦克风转录
client()
项目架构解析
WhisperLive 采用模块化设计,核心组件包括:
- 后端引擎模块 -
whisper_live/backend/多种推理后端支持 - 转录处理模块 -
whisper_live/transcriber/音频处理流水线 - 客户端服务 -
whisper_live/client.py用户交互接口
跨平台扩展支持
浏览器扩展
- Chrome 扩展 - Audio-Transcription-Chrome 网页音频实时转录
- Firefox 扩展 - Audio-Transcription-Firefox 跨浏览器兼容

