FRCRN 开源模型 WebAssembly 浏览器端轻量化部署 | 极客日志

JavaScriptNode.jsAI大前端算法

FRCRN 开源模型 WebAssembly 浏览器端轻量化部署

将阿里巴巴达摩院开源的 FRCRN 语音降噪模型通过 WebAssembly 技术部署到浏览器端的完整流程。内容包括环境搭建、PyTorch 转 ONNX 格式转换、ONNX Runtime Web 集成、音频处理模块实现及性能优化策略。实测表明该方案无需安装客户端，数据本地处理保障隐私，在主流设备上可实现低延迟实时降噪，显著提升嘈杂环境下的语音清晰度与识别率。

灰度发布发布于 2026/4/5更新于 2026/5/2327 浏览

FRCRN 开源模型 WebAssembly 浏览器端轻量化部署

在线会议背景噪声干扰严重，传统降噪软件往往需要安装庞大客户端。本文将介绍将阿里巴巴达摩院开源的 FRCRN 语音降噪模型，通过 WebAssembly 技术部署到浏览器端的方案，无需安装软件即可实现实时语音降噪。

1. 为什么选择 FRCRN 与 WebAssembly？

1.1 FRCRN：专为复杂噪声设计的降噪模型

FRCRN（Frequency-Recurrent Convolutional Recurrent Network）在频率域处理音频信号，结合卷积网络捕捉局部特征和循环网络关注长期依赖关系。该模型在单通道降噪任务上表现优异，能有效消除持续稳态噪声、突发性噪声及人声干扰，同时保持高保真度。

1.2 WebAssembly：让浏览器成为 AI 推理平台

WebAssembly（Wasm）是一种能在现代浏览器中运行的二进制指令格式，性能接近原生代码且具备安全沙箱特性。在浏览器运行 AI 模型的优势包括：

无需安装：用户打开网页授权麦克风即可使用。
数据隐私：音频数据在本地处理，不上传云端。
跨平台一致性：支持 Windows、macOS、Linux、Android、iOS。
实时性：优化后延迟可满足实时通话需求。

2. 环境准备与模型转换

2.1 开发环境搭建

基础要求：

现代浏览器（Chrome 90+、Firefox 89+、Safari 15+）
Node.js 16+（用于构建工具链）
Python 3.8+（用于模型转换脚本）

安装构建工具：

# 安装必要的 npm 包
npm install -g onnxruntime-web esbuild
# 创建项目目录
mkdir frcrn-wasm-demo
cd frcrn-wasm-demo

2.2 模型下载与格式转换

原始模型为 PyTorch 格式，需转换为 ONNX 格式以适配 Wasm。

步骤 1：下载原始模型

import torch
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

ans_pipeline = pipeline(
    task=Tasks.acoustic_noise_suppression,
    model='damo/speech_frcrn_ans_cirm_16k'
)
print("模型下载完成！")

步骤 2：转换为 ONNX 格式

import torch
import onnx
from modelscope.models import Model

model_dir = 
model = Model.from_pretrained(model_dir)
model.()

dummy_input = torch.randn(, , , )
torch.onnx.export(
    model, dummy_input, ,
    input_names=[], output_names=[],
    dynamic_axes={: {: }, : {: }},
    opset_version=
)
()

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online

frcrn-wasm-demo/
├── index.html
├── style.css
├── app.js
├── wasm/
│   ├── frcrn.onnx
│   ├── ort-wasm.wasm
│   └── ort-wasm.js
├── audio-processor.js
└── package.json

// audio-processor.js
class AudioProcessor {
    constructor() {
        this.audioContext = null;
        this.processor = null;
        this.model = null;
        this.isProcessing = false;
        this.SAMPLE_RATE = 16000;
        this.FRAME_SIZE = 512;
        this.HOP_SIZE = 256;
    }

    async init() {
        try {
            this.audioContext = new (window.AudioContext || window.webkitAudioContext)({ sampleRate: this.SAMPLE_RATE });
            await this.audioContext.resume();
            return true;
        } catch (error) {
            console.error('初始化音频上下文失败:', error);
            return false;
        }
    }

    async startProcessing() {
        if (this.isProcessing) return;
        try {
            const stream = await navigator.mediaDevices.getUserMedia({
                audio: {
                    sampleRate: this.SAMPLE_RATE,
                    channelCount: 1,
                    echoCancellation: false,
                    noiseSuppression: false,
                    autoGainControl: false
                }
            });
            const source = this.audioContext.createMediaStreamSource(stream);
            this.processor = this.audioContext.createScriptProcessor(this.FRAME_SIZE, 1, 1);
            source.connect(this.processor);
            this.processor.connect(this.audioContext.destination);
            this.processor.onaudioprocess = (event) => {
                if (!this.isProcessing || !this.model) return;
                const inputData = event.inputBuffer.getChannelData(0);
                this.processAudioFrame(inputData);
            };
            this.isProcessing = true;
        } catch (error) {
            console.error('启动音频处理失败:', error);
        }
    }

    processAudioFrame(audioData) {
        const stftData = this.computeSTFT(audioData);
        const output = await this.model.run(stftData);
        const processedAudio = this.inverseSTFT(output);
        return processedAudio;
    }

    computeSTFT(audioData) { /* 实现 STFT */ }
    inverseSTFT(spectrum) { /* 实现逆 STFT */ }
}

// app.js
class FRCRNApp {
    constructor() {
        this.audioProcessor = new AudioProcessor();
        this.session = null;
        this.isModelLoaded = false;
    }

    async loadModel() {
        const loadingElement = document.getElementById('loading');
        loadingElement.textContent = '正在加载模型...';
        try {
            const ort = await import('https://cdn.jsdelivr.net/npm/onnxruntime-web/dist/ort.min.js');
            this.session = await ort.InferenceSession.create('./wasm/frcrn.onnx', {
                executionProviders: ['wasm'],
                graphOptimizationLevel: 'all'
            });
            this.isModelLoaded = true;
            loadingElement.textContent = '模型加载完成！';
        } catch (error) {
            console.error('加载模型失败:', error);
        }
    }

    async processWithModel(inputTensor) {
        if (!this.session || !this.isModelLoaded) throw new Error('模型未加载');
        const feeds = { input: new ort.Tensor('float32', inputTensor, [1, 257, 100, 2]) };
        const results = await this.session.run(feeds);
        return results.output.data;
    }
}

class AudioBufferPool {
    constructor() { this.buffers = new Map(); }
    getBuffer(size) {
        if (!this.buffers.has(size)) this.buffers.set(size, new Float32Array(size));
        return this.buffers.get(size);
    }
}

FRCRN 开源模型 WebAssembly 浏览器端轻量化部署

FRCRN 开源模型 WebAssembly 浏览器端轻量化部署

1. 为什么选择 FRCRN 与 WebAssembly？

1.1 FRCRN：专为复杂噪声设计的降噪模型

1.2 WebAssembly：让浏览器成为 AI 推理平台

2. 环境准备与模型转换

2.1 开发环境搭建

2.2 模型下载与格式转换

更多推荐文章

相关免费在线工具

3. WebAssembly 端部署实战

3.1 项目结构设计

3.2 核心音频处理模块

3.3 ONNX Runtime 集成

3.4 性能优化技巧

4. 实际效果测试与对比

4.1 测试环境设置

4.2 效果对比分析

4.3 不同场景下的表现

5. 总结与展望

5.1 关键要点回顾

5.2 可能遇到的问题与解决方案

5.3 下一步探索方向

更多推荐文章

相关免费在线工具

FRCRN 开源模型 WebAssembly 浏览器端轻量化部署

FRCRN 开源模型 WebAssembly 浏览器端轻量化部署

1. 为什么选择 FRCRN 与 WebAssembly？

1.1 FRCRN：专为复杂噪声设计的降噪模型

1.2 WebAssembly：让浏览器成为 AI 推理平台

2. 环境准备与模型转换

2.1 开发环境搭建

2.2 模型下载与格式转换

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. WebAssembly 端部署实战

3.1 项目结构设计

3.2 核心音频处理模块

3.3 ONNX Runtime 集成

3.4 性能优化技巧

4. 实际效果测试与对比

4.1 测试环境设置

4.2 效果对比分析

4.3 不同场景下的表现

5. 总结与展望

5.1 关键要点回顾

5.2 可能遇到的问题与解决方案

5.3 下一步探索方向

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具