Whisper ASR Webservice 快速部署与 API 使用指南

Whisper ASR Webservice 是一款基于 OpenAI Whisper 的语音识别 API 服务，提供简单高效的语音转文字功能，支持多语言识别与实时转录。通过 Docker 容器化部署，可轻松拥有企业级语音识别能力。

核心优势

多引擎支持：兼容 OpenAI Whisper 与 Faster Whisper 引擎，兼顾识别准确率与速度
即开即用：Docker 一键部署，快速启动生产级 API 服务
丰富功能：支持语音转录、语言检测、多格式输出（TXT/VTT/SRT/TSV/JSON）
灵活配置：可通过环境变量自定义模型大小、识别语言等参数

技术架构

项目采用 FastAPI 构建高性能 Web 服务，通过工厂模式设计支持多引擎扩展。

快速部署指南

准备工作

确保已安装 Docker 环境，支持 Linux、macOS 和 Windows 系统。

1. 拉取镜像

根据硬件环境选择合适的镜像版本：

# CPU 版本
docker pull onerahmet/openai-whisper-asr-webservice:latest
# GPU 加速版本（需 NVIDIA Docker 支持）
docker pull onerahmet/openai-whisper-asr-webservice:latest-gpu

2. 启动服务

# CPU 启动（默认模型：base）
docker run -d -p 9000:9000 \
  -e ASR_MODEL=base \
  -e ASR_ENGINE=openai_whisper \
  onerahmet/openai-whisper-asr-webservice:latest

# GPU 加速启动
docker run -d --gpus all -p 9000:9000 \
  -e ASR_MODEL=medium \
  -e ASR_ENGINE=faster_whisper \
  onerahmet/openai-whisper-asr-webservice:latest-gpu

3. 访问 API 文档

服务启动后，访问 http://localhost:9000/docs 即可使用交互式 API 界面。

高级配置选项

模型选择

通过 ASR_MODEL 环境变量选择不同大小的模型（tiny/base/small/medium/large）：

docker run -d -p 9000:9000 \
  -e ASR_MODEL=large \
  onerahmet/openai-whisper-asr-webservice:latest

持久化模型缓存

避免重复下载模型，提升启动速度：

docker run -d -p 9000:9000 \
  -v $PWD/cache:/root/.cache \
  onerahmet/openai-whisper-asr-webservice:latest

支持的环境变量

完整配置说明参见官方文档：

ASR_MODEL：模型大小选择
：引擎类型（openai_whisper/faster_whisper）

Whisper ASR Webservice 快速部署与 API 使用指南

Whisper ASR Webservice 快速部署与 API 使用指南

核心优势

技术架构

快速部署指南

准备工作

1. 拉取镜像

2. 启动服务

3. 访问 API 文档

高级配置选项

模型选择

持久化模型缓存

支持的环境变量

更多推荐文章

相关免费在线工具

实用 API 示例

语音转录接口

语言检测接口

更多推荐文章

相关免费在线工具

Whisper ASR Webservice 快速部署与 API 使用指南

Whisper ASR Webservice 快速部署与 API 使用指南

核心优势

技术架构

快速部署指南

准备工作

1. 拉取镜像

2. 启动服务

3. 访问 API 文档

高级配置选项

模型选择

持久化模型缓存

支持的环境变量

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

实用 API 示例

语音转录接口

语言检测接口

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具