H.265 (HEVC) 网页播放:WebAssembly + FFmpeg 实现浏览器端的硬解/软解兼容方案

H.265 (HEVC) 网页播放:WebAssembly + FFmpeg 实现浏览器端的硬解/软解兼容方案

标签: #WebAssembly #FFmpeg #H.265 #WebCodecs #音视频开发 #前端性能


📉 前言:浏览器对 H.265 的“爱恨情仇”

为什么 <video src="video.h265.mp4"> 在 Chrome 里放不出来?
因为 H.265 的专利池太深了。只有 Safari (即使是 iOS) 和 Edge (需硬件支持) 原生支持较好。

我们的目标是构建一套混合解码方案

  1. 优先硬解 (WebCodecs):如果浏览器支持硬件加速(如 Chrome 94+ 的 WebCodecs),直接调用 GPU,性能起飞。
  2. 降级软解 (Wasm + FFmpeg):如果不支持,自动切换到 WebAssembly 版的 FFmpeg 进行 CPU 软解,利用 SIMD 指令集加速。

播放器架构图 (Mermaid):

🐢 方案 B: 软件解码

🚀 方案 A: 硬件解码

Yes

GPU 解码

No

Wasm指令

CPU 解码

视频流 (H.265/HEVC)

解封装 (Demuxer)

Encoded Packets

浏览器支持 WebCodecs?

WebCodecs API (VideoDecoder)

VideoFrame 对象

Web Worker

FFmpeg (Wasm + SIMD)

YUV420 数据

Canvas (WebGL)


🛠️ 一、 编译 FFmpeg 为 WebAssembly

这是最困难的一步。我们需要使用 Emscripten 将 C 语言编写的 FFmpeg 编译成 .wasm 文件。

关键编译参数:
为了性能,必须开启 Multithreading (多线程)SIMD (单指令多数据流)

# Docker 环境下编译示例 emcc \ -Llibavcodec -Llibavutil -Llibswscale \ -I. \ -o ffmpeg-decoder.js \ src/decoder.c \ -s WASM=1\ -s USE_PTHREADS=1\# 开启多线程 -s PTHREAD_POOL_SIZE=4\# 预分配线程池 -s SIMD=1\# 开启 SIMD 加速 (关键!) -s ALLOW_MEMORY_GROWTH=1\ -O3 # 最高优化等级

注意:src/decoder.c 是你需要编写的 C 语言胶水代码,用于暴露 FFmpeg 的 avcodec_send_packetavcodec_receive_frame 接口给 JS 调用。


🧬 二、 核心实现:Web Worker 中的解码循环

解码是 CPU 密集型任务,绝对不能放在主线程,否则页面会卡死。我们需要在 Web Worker 中运行 Wasm。

1. 初始化解码器 (Worker.js)
importScripts('ffmpeg-decoder.js');let decoderModule;let codecContext;// 初始化 Wasm 模块Module().then(module=>{ decoderModule = module;// 调用 C 导出的初始化函数 codecContext = decoderModule._init_h265_decoder();postMessage({type:'ready'});}); self.onmessage=function(e){const{ type, data }= e.data;if(type ==='decode'){// data 是包含 H.265 NALU 的 Uint8Array// 1. 将数据写入 Wasm 内存 heapconst ptr = decoderModule._malloc(data.length); decoderModule.HEAPU8.set(data, ptr);// 2. 调用解码// decode_frame 是 C 层封装的函数const ret = decoderModule._decode_frame(codecContext, ptr, data.length);// 3. 获取 YUV 数据并传回主线程if(ret ===0){// 从 Wasm 内存拷贝 Y, U, V 数据// 注意:使用 Transferable Objects (零拷贝) 提升性能const yuvData =getYUVFromWasm();postMessage({type:'render',frame: yuvData },[yuvData.buffer]);} decoderModule._free(ptr);}};

🎨 三、 高性能渲染:WebGL 处理 YUV

FFmpeg 解码出来的数据通常是 YUV420p 格式。
不要在 CPU 里把 YUV 转 RGB(这非常慢),要用 WebGL Shader 在 GPU 里转!

渲染流程:

  1. 创建 3 个 WebGL 纹理 (Texture),分别存放 Y、U、V 数据。
  2. 编写 Fragment Shader 进行矩阵转换。

Fragment Shader (GLSL):

precision mediump float; uniform sampler2D textureY; uniform sampler2D textureU; uniform sampler2D textureV; varying vec2 vTexCoord; void main() { float y = texture2D(textureY, vTexCoord).r; float u = texture2D(textureU, vTexCoord).r - 0.5; float v = texture2D(textureV, vTexCoord).r - 0.5; // YUV 转 RGB 公式 (BT.601) float r = y + 1.402 * v; float g = y - 0.34414 * u - 0.71414 * v; float b = y + 1.772 * u; gl_FragColor = vec4(r, g, b, 1.0); } 

⏱️ 四、 难点攻克:音画同步 (AV Sync)

视频能播了,但声音和画面对不上怎么办?
通常以 音频时钟 (Audio Clock) 为基准。

同步逻辑图 (Mermaid):

PTS < AudioTime (视频慢了)

PTS > AudioTime (视频快了)

PTS ≈ AudioTime (刚好)

渲染循环 Loop

当前视频帧 PTS vs 音频时间

丢帧 Skip Frame

等待 Delay

渲染到 Canvas

在 JS 主线程中:

functionrenderLoop(){const audioTime = audioContext.currentTime;const frame = frameBuffer[0];// 获取队列头部的帧if(!frame)returnrequestAnimationFrame(renderLoop);const diff = frame.pts - audioTime;if(diff <-0.03){// 视频落后超过 30ms -> 丢帧追赶 frameBuffer.shift();renderLoop();}elseif(diff >0.03){// 视频超前 -> 等待下一帧绘制requestAnimationFrame(renderLoop);}else{// 同步 -> 渲染drawYUV(frame); frameBuffer.shift();requestAnimationFrame(renderLoop);}}

📊 五、 性能优化清单

为了达到 1080p 甚至 4K 的流畅播放,以下优化必不可少:

  1. 开启 SIMD:在支持 SIMD 的浏览器上,软解性能提升 2-3 倍
  2. SharedArrayBuffer:在主线程和 Worker 之间共享内存,避免数据拷贝开销(需要配置 HTTP Header: Cross-Origin-Opener-Policy: same-origin)。
  3. OffscreenCanvas:将 Canvas 的控制权转移给 Worker,让渲染也在 Worker 线程完成,彻底解放主线程 UI。
  4. WebCodecs 优先:始终检测 VideoDecoder API。如果支持硬件解码,直接 bypass 掉 Wasm 模块,这是性能的降维打击。

🎯 总结

通过 Wasm + FFmpeg + WebGL,我们填补了浏览器 H.265 支持的空白。虽然软解 4K 依然吃力(主要受限于单线程 JS 调度和 CPU 算力),但在 720p/1080p 监控流、会议流场景下,这是一套成熟且工业级的解决方案。

Next Step:
现在的方案是基于现成 MP4 文件的。尝试结合 WebSocketWebRTC,接收实时的 H.265 NALU 流(如 RTSP 转 WS),实现一个低延迟的网页版安防监控播放器。

Read more

玩转ClaudeCode:使用Figma-MCP编写前端代码1:1还原UI设计图

玩转ClaudeCode:使用Figma-MCP编写前端代码1:1还原UI设计图

目录 本轮目标 具体实践 一、开启 Figma 的 MCP 服务器 二、Claude Code 连接 Figma MCP 三、Claude Code 代码实现 Figma 设计稿 本轮目标 本轮目标是制作数字化大屏的一个前端组件,要求和UI设计图还原度达到1:1。 本轮目标需要我们提前准备好figma客户端,且登录帐号具有开发模式的权限(没有可以去某夕)。Claude Code 就不必多说,没有安装的同学参考我的上一篇文章《玩转ClaudeCode:ClaudeCode安装教程(Windows+Linux+MacOS)》完成安装,通过专属链接注册,可以额外领取100美金的免费使用额度。 安装教程参考:玩转ClaudeCode:ClaudeCode安装教程(Windows+Linux+MacOS)_claude code安装-ZEEKLOG博客文章浏览阅读2.5w次,点赞67次,

Flutter 三方库 shelf_web_socket 的鸿蒙化适配指南 - 实现具备高性能全双工长连接与协议协商能力的端侧服务端架构、支持分布式实时信令与多端协同实战

Flutter 三方库 shelf_web_socket 的鸿蒙化适配指南 - 实现具备高性能全双工长连接与协议协商能力的端侧服务端架构、支持分布式实时信令与多端协同实战

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 shelf_web_socket 的鸿蒙化适配指南 - 实现具备高性能全双工长连接与协议协商能力的端侧服务端架构、支持分布式实时信令与多端协同实战 前言 在进行 Flutter for OpenHarmony 开发时,当我们的鸿蒙应用需要充当“控制中心”角色(如控制智能家居、开启本地调试服务或实现 P2P 实时对抗脚本时),如何在端侧直接拉起一个支持 WebSocket 协议的高性能微服务端?shelf_web_socket 是针对 shelf 后端框架封装的一款官方级 WebSocket 处理器。本文将探讨如何在鸿蒙端构建极致、透明的长连接交互引擎。 一、原直观解析 / 概念介绍 1.1 基础原理 该库本质上是一个 shelf 处理函数(Handler)

【LLM】Ollama:本地大模型 WebAPI 调用实战指南

1. 为什么选择Ollama部署本地大模型 最近两年大模型技术发展迅猛,但很多开发者面临一个现实问题:公有云API调用不仅费用高昂,还存在数据隐私风险。Ollama的出现完美解决了这个痛点,它就像是你本地的模型管家,可以一键部署各种开源大模型。我去年在开发智能客服系统时就深受其益,既避免了敏感客户数据外泄,又省下了大笔API调用费用。 与传统方案相比,Ollama有三大优势:首先是安装简单,用Docker一条命令就能跑起来;其次是模型丰富,支持Llama、Mistral等主流开源模型;最重要的是API标准化,完全兼容OpenAI的接口规范。实测在16GB内存的MacBook Pro上运行7B参数的模型,响应速度可以控制在2秒以内,完全能满足大多数应用场景。 2. 五分钟快速搭建Ollama环境 2.1 准备工作就像搭积木 在开始之前,我们需要准备两个基础组件:Docker和Python环境。这里有个小技巧分享——建议使用Docker Desktop的WSL2后端(Windows用户),性能比传统虚拟机模式提升30%以上。安装完成后,记得执行以下命令验证版本: docker

Java Web 开发:JSON 基础 + @Test 测试 + Cookie/Session/ 请求处理

Java Web 开发:JSON 基础 + @Test 测试 + Cookie/Session/ 请求处理

个人主页:♡喜欢做梦 欢迎  👍点赞  ➕关注  ❤️收藏  💬评论 目录 编辑 🍍JSON的概念  🍐概念  🍐@Test注解 🍑什么是@Test? 🍑与JSON关联 🍑@Test标记的方法与main方法的区别  🍍JSON语法  🍐核心数据类型  🍐常见使用 🍑对象 🍑数组  🍑JSON字符串和Java对象的互转 🍑传递JSON 🍑获取URL中的参数 🍑上传文件:@RequestPart  🍍Cookie和Seeion  🍐Cookie 🍑什么是Cookie? 🍑Cookie的获取  🍐Session 🍑什么是Session?  🍐Cookie和Session之间的关系 🍑Session的存储 🍑Session的获取 🍍获取header 🍍JSON的概念  🍐概念 JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,易于人阅读和编写,同时也易于机器解析和生成。他基于JavaScript的一个子集,但采用了独立语言的文