FunASR 离线语音转写服务部署与客户端开发实战 | 极客日志

编程语言AIjava算法

FunASR 离线语音转写服务部署与客户端开发实战

FunASR 离线文件转写服务提供完整的语音识别链路，支持长音频视频识别及标点生成。详述基于 Docker 的部署流程，包括服务端启动参数配置、多语言客户端（Python/C++/Java）调用方法及常见问题处理。通过实际测试对比，验证了其在中文场景下的识别效果，适合需要私有化部署语音转写能力的开发者参考。

魔法巫师发布于 2026/4/9更新于 2026/7/2340 浏览

FunASR 离线语音转写服务部署与客户端开发实战

1. 概述

FunASR（Automatic Speech Recognition）离线文件转写软件包提供了一款功能强大的语音离线文件转写服务。它拥有完整的语音识别链路，结合了语音端点检测（VAD）、语音识别、标点等模型，可以将几十个小时的长音频与视频识别成带标点的文字，支持上百路请求同时进行转写。

输出结果包含带标点的文字及字级别时间戳，支持 ITN（逆文本规范化）与用户自定义热词。服务端集成有 ffmpeg，支持各种音视频格式输入。软件包提供 HTML、Python、C++、Java 与 C# 等多种编程语言客户端，方便直接集成与二次开发。

推荐配置：

配置 1: X86 计算型，4 核 vCPU，内存 8G，单机约支持 32 路请求
配置 2: X86 计算型，16 核 vCPU，内存 32G，单机约支持 64 路请求
配置 3: X86 计算型，64 核 vCPU，内存 128G，单机约支持 200 路请求

2. 快速上手

2.1 Docker 安装

推荐使用官方脚本进行安装：

# 下载安装脚本
curl -O https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/shell/install_docker.sh
# 执行安装命令
sudo bash install_docker.sh

2.2 镜像启动

拉取并启动 FunASR 软件包的 Docker 镜像：

# 拉取镜像
sudo docker pull registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-cpu-0.4.7
# 创建资源文件夹
mkdir -p ./funasr-runtime-resources/models
# 交互式启动容器
sudo docker run -p 10095:10095 -it --privileged=true \
-v $PWD/funasr-runtime-resources/models:/workspace/models \
registry.cn-hangzhou.aliyuncs.com/funasr_repo/funasr:funasr-runtime-sdk-cpu-0.4.7

2.3 服务端启动

进入容器后启动 funasr-wss-server 服务程序：

# 容器内的操作
cd FunASR/runtime
nohup bash run_server.sh \
--download-model-dir /workspace/models \
--vad-dir damo/speech_fsmn_vad_zh-cn-16k-common-onnx \
--model-dir damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-onnx \
--punc-dir damo/punc_ct-transformer_cn-en-common-vocab471067-large-onnx \
--lm-dir damo/speech_ngram_lm_zh-cn-ai-wesp-fst \
--itn-dir thuduj12/fst_itn_zh \
--hotword /workspace/models/hotwords.txt > log.txt 2>&1 &

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online

wget https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/sample/funasr_samples.tar.gz

python3 funasr_wss_client.py --host "127.0.0.1" --port 10095 --mode offline --audio_in "../audio/asr_example.wav"

python3 funasr_wss_client.py --host "127.0.0.1" --port 10095 --mode offline \
--audio_in "../audio/asr_example.wav" --output_dir "./results"

./funasr-wss-client --server-ip 127.0.0.1 --port 10095 --wav-path ../audio/asr_example.wav

FunasrWsClient --host localhost --port 10095 --audio_in ./asr_example.wav --mode offline

cd /workspace/FunASR/runtime
nohup bash run_server.sh \
--download-model-dir /workspace/models \
--model-dir damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-onnx \
--vad-dir damo/speech_fsmn_vad_zh-cn-16k-common-onnx \
--punc-dir damo/punc_ct-transformer_cn-en-common-vocab471067-large-onnx \
--lm-dir damo/speech_ngram_lm_zh-cn-ai-wesp-fst \
--itn-dir thuduj12/fst_itn_zh \
--certfile ../../../ssl_key/server.crt \
--keyfile ../../../ssl_key/server.key \
--hotword ../../hotwords.txt > log.txt 2>&1 &

ps -x | grep funasr-wss-server
kill -9 PID

// VAD 模型的使用分为 FsmnVadInit 和 FsmnVadInfer 两个步骤
FUNASR_HANDLE vad_hanlde = FsmnVadInit(model_path, thread_num);
FUNASR_RESULT result = FsmnVadInfer(vad_hanlde, wav_file.c_str(), NULL, 16000);

// ASR 模型的使用分为 FunOfflineInit 和 FunOfflineInfer 两个步骤
FUNASR_HANDLE asr_hanlde = FunOfflineInit(model_path, thread_num);
FUNASR_RESULT result = FunOfflineInfer(asr_hanlde, wav_file.c_str(), RASR_NONE, NULL, 16000);

// PUNC 模型的使用分为 CTTransformerInit 和 CTTransformerInfer 两个步骤
FUNASR_HANDLE punc_hanlde = CTTransformerInit(model_path, thread_num);
FUNASR_RESULT result = CTTransformerInfer(punc_hanlde, txt_str.c_str(), RASR_NONE, NULL);

FunASR 离线语音转写服务部署与客户端开发实战

FunASR 离线语音转写服务部署与客户端开发实战

1. 概述

2. 快速上手

2.1 Docker 安装

2.2 镜像启动

2.3 服务端启动

更多推荐文章

相关免费在线工具

2.4 客户端测试与使用

3. 客户端用法详解

3.1 Python Client

3.2 C++ Client

3.3 HTML 网页版

3.4 Java Client

4. 服务端用法详解

4.1 启动 FunASR 服务

4.2 关闭 FunASR 服务

4.3 修改模型及其他参数

5. 如何定制服务部署

更多推荐文章

相关免费在线工具

FunASR 离线语音转写服务部署与客户端开发实战

FunASR 离线语音转写服务部署与客户端开发实战

1. 概述

2. 快速上手

2.1 Docker 安装

2.2 镜像启动

2.3 服务端启动

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.4 客户端测试与使用

3. 客户端用法详解

3.1 Python Client

3.2 C++ Client

3.3 HTML 网页版

3.4 Java Client

4. 服务端用法详解

4.1 启动 FunASR 服务

4.2 关闭 FunASR 服务

4.3 修改模型及其他参数

5. 如何定制服务部署

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具