一、技术选型说明
为什么选择 mutablelogic/go-whisper
- 生产就绪: 提供完整的 HTTP API 服务,符合 OpenAI API 规范
- 多架构支持: 支持 amd64 和 arm64,兼容 CPU 和 GPU(CUDA/Vulkan/Metal)
- 统一接口: 支持本地模型 (Whisper.cpp) 和云端 API(OpenAI/ElevenLabs)
- 易部署: 提供预构建的 Docker 镜像和源码构建方式
- OpenTelemetry 集成: 内置可观测性支持
Whisper-Tiny 模型特点
- 模型大小:~75MB
- 内存占用:~390MB
- 速度:最快
- 准确率:相对较低,但适合实时场景
二、系统要求
硬件要求
- Ubuntu 20.04 LTS
- CPU: 4 核心以上推荐
- 内存:8GB 以上 (Tiny 模型需~400MB)
- 存储:至少 5GB 可用空间
- (可选) NVIDIA GPU: 支持 CUDA 加速
软件要求
- Go 1.22+ (已安装)
- Docker (推荐用于生产部署)
- CMake 和 C++ 编译器 (如从源码编译)
- FFmpeg (音频处理)
三、部署方式选择
方式一:Docker 部署 (推荐生产环境)
优点:
- 隔离性好,环境一致性高
- 部署快速,一键启动
- 易于扩展和管理
适用场景:
- 生产环境
- 快速测试验证
- 多实例部署
方式二:源码编译部署
优点:
- 可自定义编译选项
- 无 Docker 依赖
- 可深度调试
适用场景:
- 开发调试
- 需要自定义功能
- 学习研究
四、Docker 部署方案 (推荐)
4.1 安装 Docker 和 Docker Compose
# 更新包索引
sudo apt update
# 安装依赖
sudo apt install -y apt-transport-https ca-certificates curl gnupg lsb-release
# 添加 Docker 官方 GPG 密钥
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg
# 设置 Docker 稳定版仓库
| /etc/apt/sources.list.d/docker.list > /dev/null

