FRCRN 开源模型实战：WebAssembly 浏览器端轻量化部署 | 极客日志

JavaScriptNode.jsAI大前端算法

FRCRN 开源模型实战：WebAssembly 浏览器端轻量化部署

介绍如何将阿里巴巴达摩院开源的 FRCRN 语音降噪模型部署至浏览器端。通过 WebAssembly 技术结合 ONNX Runtime，实现无需安装客户端的实时音频降噪。内容涵盖环境搭建、PyTorch 转 ONNX 模型转换、Wasm 推理集成及性能优化。测试表明，在 M1 MacBook 上延迟约 50ms，降噪效果显著且保真度高，适用于在线会议、录音及语音识别预处理场景。

性能调优发布于 2026/4/6更新于 2026/7/2143 浏览

FRCRN 开源模型实战：WebAssembly 浏览器端轻量化部署

在线会议背景噪声处理是常见痛点。本文介绍将阿里巴巴达摩院开源的 FRCRN 语音降噪模型通过 WebAssembly 技术部署到浏览器端的方案。无需安装客户端，打开网页即可实现实时语音降噪。

1. 为什么选择 FRCRN 与 WebAssembly？

1.1 FRCRN：专为复杂噪声设计的降噪高手

FRCRN 全称 Frequency-Recurrent Convolutional Recurrent Network，翻译过来是'频率循环卷积循环网络'。核心思想是在频率域里处理音频信号，同时捕捉局部特征和长期依赖关系。

该模型在 ModelScope 社区开源后，在单通道降噪任务上表现相当出色。测试显示典型场景效果如下：

持续稳态噪声：像空调声、风扇声这种背景音，几乎能完全消除
突发性噪声：键盘敲击声、关门声，能显著减弱
人声干扰：背景里的谈话声，处理效果也不错

最重要的是，它在消除噪声的同时，对人声的保真度很高。你不会听到那种'机器人声'或者'水下通话'的失真效果。

1.2 WebAssembly：让浏览器成为 AI 推理平台

WebAssembly（简称 Wasm）是一种能在现代浏览器中运行的二进制指令格式，性能接近原生代码，但保持了 Web 应用的安全沙箱特性。

在浏览器里跑 AI 模型有几个明显优势：

无需安装，即开即用 用户不需要下载几百 MB 的客户端，也不需要配置复杂的 Python 环境。打开网页，授权麦克风，就能开始降噪。

数据隐私得到保障 音频数据不需要上传到云端服务器，在本地浏览器里就完成了处理。这对处理敏感对话的场景至关重要。

跨平台一致性 无论是 Windows、macOS、Linux，还是 Android、iOS，只要浏览器支持 Wasm，体验就是一致的。

实时性足够好 经过优化后，Wasm 版本的推理速度能满足实时处理的需求。在 M1 MacBook Air 上测试，16kHz 音频的延迟在 50ms 左右，完全不影响正常通话。

2. 环境准备与模型转换

2.1 开发环境搭建

基础要求：

现代浏览器（Chrome 90+、Firefox 89+、Safari 15+）
Node.js 16+（用于构建工具链）
Python 3.8+（用于模型转换脚本）

安装构建工具：

# 如果你还没有 Node.js，先安装它 # 可以从 https://nodejs.org/ 下载 LTS 版本 # 安装必要的 npm 包 npm install -g onnxruntime-web npm install -g esbuild # 创建一个新的项目目录 mkdir frcrn-wasm-demo cd frcrn-wasm-demo

2.2 模型下载与格式转换

FRCRN 的原始模型是 PyTorch 格式的，我们需要把它转换成 ONNX 格式，然后再优化为适合 Wasm 运行的版本。

步骤 1：下载原始模型

import torch from modelscope.pipelines import pipeline from modelscope.utils.constant import Tasks # 这会自动下载模型到本地缓存 ans_pipeline = pipeline( task=Tasks.acoustic_noise_suppression, model='damo/speech_frcrn_ans_cirm_16k' ) print("模型下载完成！缓存位置通常在：~/.cache/modelscope/hub")

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online

import torch import onnx from modelscope.models import Model from modelscope.preprocessors import build_preprocessor # 加载模型 model_dir = '~/.cache/modelscope/hub/damo/speech_frcrn_ans_cirm_16k' model = Model.from_pretrained(model_dir) model.eval() # 创建一个示例输入 # FRCRN 输入是复数频谱，维度为 [batch, frequency, time, 2] # 2 代表实部和虚部 dummy_input = torch.randn(1, 257, 100, 2) # 导出为 ONNX torch.onnx.export( model, dummy_input, "frcrn_model.onnx", input_names=["input"], output_names=["output"], dynamic_axes={ 'input': {2: 'time'}, # 时间维度可变 'output': {2: 'time'} }, opset_version=13 ) print("ONNX 模型导出完成！")

# 使用 ONNX Runtime 的工具进行优化 python -m onnxruntime.tools.convert_onnx_models_to_ort frcrn_model.onnx # 这会生成一个优化后的 .ort 文件 # 我们还需要把它转换成适合 WebAssembly 的格式

frcrn-wasm-demo/
├── index.html # 主页面
├── style.css # 样式文件
├── app.js # 主逻辑
├── wasm/
│   ├── frcrn.onnx # 优化后的模型
│   ├── ort-wasm.wasm # ONNX Runtime 的 Wasm 后端
│   └── ort-wasm.js # JavaScript 绑定
├── audio-processor.js # 音频处理模块
└── package.json # 项目配置

// audio-processor.js
class AudioProcessor {
  constructor() {
    this.audioContext = null;
    this.processor = null;
    this.model = null;
    this.isProcessing = false;
    // 音频参数 - 必须与模型匹配
    this.SAMPLE_RATE = 16000;
    this.FRAME_SIZE = 512; // 每次处理的样本数
    this.HOP_SIZE = 256; // 重叠采样，保证连续性
  }

  // 初始化音频上下文
  async init() {
    try {
      this.audioContext = new (window.AudioContext || window.webkitAudioContext)({ sampleRate: this.SAMPLE_RATE });
      await this.audioContext.resume();
      return true;
    } catch (error) {
      console.error('初始化音频上下文失败:', error);
      return false;
    }
  }

  // 开始处理麦克风输入
  async startProcessing() {
    if (this.isProcessing) return;
    try {
      // 获取麦克风权限
      const stream = await navigator.mediaDevices.getUserMedia({
        audio: {
          sampleRate: this.SAMPLE_RATE,
          channelCount: 1, // 单声道
          echoCancellation: false,
          noiseSuppression: false, // 禁用浏览器的降噪
          autoGainControl: false
        }
      });

      // 创建音频源
      const source = this.audioContext.createMediaStreamSource(stream);

      // 创建 ScriptProcessorNode 处理音频数据
      this.processor = this.audioContext.createScriptProcessor(
        this.FRAME_SIZE,
        1, // 输入通道数
        1 // 输出通道数
      );

      // 连接节点
      source.connect(this.processor);
      this.processor.connect(this.audioContext.destination);

      // 处理音频帧
      this.processor.onaudioprocess = (event) => {
        if (!this.isProcessing || !this.model) return;
        const inputData = event.inputBuffer.getChannelData(0);
        this.processAudioFrame(inputData);
      };

      this.isProcessing = true;
      console.log('音频处理已启动');
    } catch (error) {
      console.error('启动音频处理失败:', error);
    }
  }

  // 处理单帧音频
  async processAudioFrame(audioData) {
    // 这里需要将时域信号转换为频域
    // 并准备成模型需要的输入格式
    const stftData = this.computeSTFT(audioData);
    // 调用模型推理
    const output = await this.model.run(stftData);
    // 将结果转换回时域
    const processedAudio = this.inverseSTFT(output);
    return processedAudio;
  }

  // 短时傅里叶变换
  computeSTFT(audioData) {
    // 实现 STFT，将时域信号转为频域
    // 返回复数频谱，维度为 [frequency, time, 2]
    // 2 代表实部和虚部
  }

  // 逆短时傅里叶变换
  inverseSTFT(spectrum) {
    // 将频域信号转回时域
  }
}

// app.js - 主要逻辑
class FRCRNApp {
  constructor() {
    this.audioProcessor = new AudioProcessor();
    this.session = null;
    this.isModelLoaded = false;
  }

  async init() {
    // 初始化 UI
    this.initUI();
    // 初始化音频
    const audioReady = await this.audioProcessor.init();
    if (!audioReady) {
      this.showError('无法初始化音频设备');
      return;
    }
    // 加载模型
    await this.loadModel();
    // 设置事件监听
    this.setupEventListeners();
  }

  async loadModel() {
    const loadingElement = document.getElementById('loading');
    loadingElement.textContent = '正在加载模型...';
    try {
      // 动态导入 ONNX Runtime
      const ort = await import('https://cdn.jsdelivr.net/npm/onnxruntime-web/dist/ort.min.js');
      // 创建推理会话
      // 注意：需要将模型文件放在可访问的位置
      this.session = await ort.InferenceSession.create(
        './wasm/frcrn.onnx',
        {
          executionProviders: ['wasm'],
          graphOptimizationLevel: 'all'
        }
      );
      this.isModelLoaded = true;
      loadingElement.textContent = '模型加载完成！';
      console.log('ONNX Runtime 会话创建成功');
    } catch (error) {
      console.error('加载模型失败:', error);
      this.showError(`模型加载失败：${error.message}`);
    }
  }

  async processWithModel(inputTensor) {
    if (!this.session || !this.isModelLoaded) {
      throw new Error('模型未加载');
    }
    try {
      // 准备输入
      const feeds = { input: new ort.Tensor('float32', inputTensor, [1, 257, 100, 2]) };
      // 执行推理
      const results = await this.session.run(feeds);
      // 获取输出
      const outputTensor = results.output.data;
      return outputTensor;
    } catch (error) {
      console.error('推理失败:', error);
      throw error;
    }
  }

  // 其他 UI 相关方法...
  initUI() {
    // 创建控制界面
    const appContainer = document.getElementById('app');
    appContainer.innerHTML = `
      <div>
        <h1>FRCRN 浏览器端实时降噪</h1>
        <div>
          <button>开始降噪</button>
          <button disabled>停止</button>
          <div>
            <div>准备就绪</div>
            <div>延迟：-- ms</div>
          </div>
        </div>
        <div>
          <canvas></canvas>
          <canvas></canvas>
        </div>
        <div>
          <h3>使用说明：</h3>
          <ol>
            <li>点击'开始降噪'按钮，授权麦克风访问</li>
            <li>正常说话，系统会自动处理背景噪声</li>
            <li>上方的波形图会显示处理前后的对比</li>
            <li>停止后可以下载处理后的音频</li>
          </ol>
        </div>
      </div>
    `;
  }
}

// 启动应用
window.addEventListener('DOMContentLoaded', async () => {
  const app = new FRCRNApp();
  await app.init();
});

// 重用内存缓冲区
class AudioBufferPool {
  constructor() {
    this.buffers = new Map();
  }

  getBuffer(size) {
    if (!this.buffers.has(size)) {
      this.buffers.set(size, new Float32Array(size));
    }
    return this.buffers.get(size);
  }
}

// 在 AudioProcessor 中使用
this.bufferPool = new AudioBufferPool();
processAudioFrame(audioData) {
  // 重用缓冲区，避免频繁创建
  const buffer = this.bufferPool.getBuffer(audioData.length);
  buffer.set(audioData);
  // ... 处理 buffer
}

// 使用 Web Workers 进行并行计算
class STFTWorker {
  constructor() {
    this.worker = new Worker('stft-worker.js');
    this.callbacks = new Map();
    this.taskId = 0;
    this.worker.onmessage = (event) => {
      const { id, result } = event.data;
      const callback = this.callbacks.get(id);
      if (callback) {
        callback(result);
        this.callbacks.delete(id);
      }
    };
  }

  computeSTFT(audioData) {
    return new Promise((resolve) => {
      const id = this.taskId++;
      this.callbacks.set(id, resolve);
      this.worker.postMessage({ id, type: 'stft', data: audioData });
    });
  }
}

// 调整帧大小和重叠率
// 较小的帧大小降低延迟，但可能影响质量
const OPTIMAL_CONFIGS = [
  { frameSize: 256, hopSize: 128, latency: 16 }, // 低延迟模式
  { frameSize: 512, hopSize: 256, latency: 32 }, // 平衡模式（默认）
  { frameSize: 1024, hopSize: 512, latency: 64 } // 高质量模式
];

// 根据设备性能自动选择
autoSelectConfig() {
  const perf = window.performance.now();
  // 简单性能测试
  // ... 测试不同配置的推理时间
  return OPTIMAL_CONFIGS[1]; // 默认使用平衡模式
}

FRCRN 开源模型实战：WebAssembly 浏览器端轻量化部署

FRCRN 开源模型实战：WebAssembly 浏览器端轻量化部署

1. 为什么选择 FRCRN 与 WebAssembly？

1.1 FRCRN：专为复杂噪声设计的降噪高手

1.2 WebAssembly：让浏览器成为 AI 推理平台

2. 环境准备与模型转换

2.1 开发环境搭建

2.2 模型下载与格式转换

更多推荐文章

相关免费在线工具

3. WebAssembly 端部署实战

3.1 项目结构设计

3.2 核心音频处理模块

3.3 ONNX Runtime 集成

3.4 性能优化技巧

4. 实际效果测试与对比

4.1 测试环境设置

4.2 效果对比分析

4.3 不同场景下的表现

5. 总结与展望

5.1 关键要点回顾

5.2 可能遇到的问题与解决方案

5.3 下一步的探索方向

更多推荐文章

相关免费在线工具

FRCRN 开源模型实战：WebAssembly 浏览器端轻量化部署

FRCRN 开源模型实战：WebAssembly 浏览器端轻量化部署

1. 为什么选择 FRCRN 与 WebAssembly？

1.1 FRCRN：专为复杂噪声设计的降噪高手

1.2 WebAssembly：让浏览器成为 AI 推理平台

2. 环境准备与模型转换

2.1 开发环境搭建

2.2 模型下载与格式转换

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. WebAssembly 端部署实战

3.1 项目结构设计

3.2 核心音频处理模块

3.3 ONNX Runtime 集成

3.4 性能优化技巧

4. 实际效果测试与对比

4.1 测试环境设置

4.2 效果对比分析

4.3 不同场景下的表现

5. 总结与展望

5.1 关键要点回顾

5.2 可能遇到的问题与解决方案

5.3 下一步的探索方向

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具