Whisper ASR Webservice 快速部署与 API 使用指南
Whisper ASR Webservice 是一款基于 OpenAI Whisper 的语音识别 API 服务,提供简单高效的语音转文字功能,支持多语言识别与实时转录。通过 Docker 容器化部署,可轻松拥有企业级语音识别能力。
核心优势
- 多引擎支持:兼容 OpenAI Whisper 与 Faster Whisper 引擎,兼顾识别准确率与速度
- 即开即用:Docker 一键部署,快速启动生产级 API 服务
- 丰富功能:支持语音转录、语言检测、多格式输出(TXT/VTT/SRT/TSV/JSON)
- 灵活配置:可通过环境变量自定义模型大小、识别语言等参数
技术架构
项目采用 FastAPI 构建高性能 Web 服务,通过工厂模式设计支持多引擎扩展。
快速部署指南
准备工作
确保已安装 Docker 环境,支持 Linux、macOS 和 Windows 系统。
1. 拉取镜像
根据硬件环境选择合适的镜像版本:
# CPU 版本
docker pull onerahmet/openai-whisper-asr-webservice:latest
# GPU 加速版本(需 NVIDIA Docker 支持)
docker pull onerahmet/openai-whisper-asr-webservice:latest-gpu
2. 启动服务
# CPU 启动(默认模型:base)
docker run -d -p 9000:9000 \
-e ASR_MODEL=base \
-e ASR_ENGINE=openai_whisper \
onerahmet/openai-whisper-asr-webservice:latest
# GPU 加速启动
docker run -d --gpus all -p 9000:9000 \
-e ASR_MODEL=medium \
-e ASR_ENGINE=faster_whisper \
onerahmet/openai-whisper-asr-webservice:latest-gpu
3. 访问 API 文档
服务启动后,访问 http://localhost:9000/docs 即可使用交互式 API 界面。
高级配置选项
模型选择
通过 ASR_MODEL 环境变量选择不同大小的模型(tiny/base/small/medium/large):
docker run -d -p 9000:9000 \
-e ASR_MODEL=large \
onerahmet/openai-whisper-asr-webservice:latest
持久化模型缓存
避免重复下载模型,提升启动速度:
docker run -d -p 9000:9000 \
-v $PWD/cache:/root/.cache \
onerahmet/openai-whisper-asr-webservice:latest
支持的环境变量
完整配置说明参见官方文档:
ASR_MODEL:模型大小选择ASR_ENGINE:引擎类型(openai_whisper/faster_whisper)

