SenseVoice-Small ONNX 量化版快速部署及 Gradio 使用指南
1. 环境准备与快速部署
1.1 系统要求与前置准备
在开始之前,确保你的环境满足以下基本要求:
- 操作系统:Linux (Ubuntu 18.04+)、Windows 10+ 或 macOS
- Python 版本:Python 3.8 或更高版本
- 内存要求:至少 4GB RAM(推荐 8GB)
- 存储空间:约 2GB 可用空间用于模型文件
如果你还没有安装 Python,可以从 Python 官网 下载安装包。
1.2 一键安装依赖包
打开终端或命令提示符,执行以下命令安装所需依赖:
# 安装 ModelScope 和 Gradio
pip install modelscope gradio
# 安装音频处理相关库
pip install soundfile librosa
# 安装 ONNX 运行时(如果尚未安装)
pip install onnxruntime
这些库的作用分别是:
modelscope:用于加载和管理 AI 模型gradio:构建友好的 Web 界面soundfile和librosa:处理音频文件onnxruntime:运行量化后的 ONNX 模型
2. 快速上手:运行语音识别演示
2.1 启动 Gradio 前端界面
SenseVoice-Small 已经内置了完整的 Web 界面,只需简单几步即可启动:
# 进入 webui.py 所在目录(通常在/usr/local/bin/)
cd /usr/local/bin/
# 启动 Gradio 界面
python webui.py
执行命令后,你会看到类似下面的输出:
Running on local URL: http://127.0.0.1:7860
这表示服务已经启动成功,现在你可以在浏览器中打开这个网址使用语音识别功能了。
2.2 首次加载说明
重要提示:第一次运行时会自动下载模型文件,这个过程可能需要几分钟时间,具体取决于你的网络速度。这是正常现象,请耐心等待。
模型下载完成后,界面会自动刷新并显示可用的功能。
3. 使用 Gradio 界面进行语音识别
3.1 界面功能概览
打开浏览器访问 http://127.0.0.1:7860,你会看到以下主要功能区域:
- 示例音频区:提供预置的测试音频,点击即可加载
- 上传音频区:支持上传 MP3、WAV 等常见音频格式
- :可以直接使用麦克风录制音频

