Three.js + WebGL 粒子动画实测:10 万粒子,流畅无压力

Three.js + WebGL 粒子动画实测:10 万粒子,流畅无压力

 ​​​​​

测试环境

Windows 桌面,WinForms + OpenTK (OpenGL 3.3)。

处理器    Intel(R) Core(TM) i9-14900HX (2.20 GHz)
机带 RAM    32.0 GB (31.7 GB 可用)
系统类型    64 位操作系统, 基于 x64 的处理器
操作系统版本    Windows 11 家庭中文版


实现原理

核心思路是:用 C# 承载页面,用 Three.js 组织 3D 场景,用 WebGL 做底层 GPU 绘制。

整体如下:

1. `WPF` 窗口中嵌入 `WebView2`。

2. 在 C# 中动态拼接 HTML,并通过 `NavigateToString` 注入页面。

3. 页面侧加载 `three.min.js`,创建 `Scene / Camera / WebGLRenderer`。

4. 粒子通过 `THREE.BufferGeometry` 与多个 `BufferAttribute` 存储。

5. 每帧在 JS 中更新粒子位置与生命周期,提交属性更新后由 GPU 渲染。

6. 页面每秒统计一次 FPS,通过 `window.chrome.webview.postMessage(...)` 回传给 C#,在 UI 上实时显示。

总结为:这是一个“CPU 负责粒子状态更新,GPU 负责大规模点精灵绘制”的混合型架构。


关键技术点

1. 跨技术栈集成:WPF 与 Web 3D 的桥接

- C# 端调用 `EnsureCoreWebView2Async()` 初始化浏览器内核。

- 使用 `WebMessageReceived` 接收前端消息,把 FPS 同步回桌面 UI。

- 这样可以让原生桌面应用拥有 WebGL 渲染能力,同时保留 WPF 的业务壳层。

2. 大规模粒子数据结构:BufferGeometry

- 粒子位置、颜色、尺寸、生命周期都以 `Float32Array` 组织。

- 通过 `geometry.setAttribute(...)` 绑定到 GPU 可消费的缓冲属性。

- 相比逐对象管理,**结构化数组 + 批量绘制**是海量粒子的基础。

3. 自定义 Shader:粒子视觉在 GPU 完成

- 顶点着色器负责点大小透视缩放、生命周期透明度系数计算。

- 片段着色器利用 `gl_PointCoord` 裁剪圆形粒子并做柔和边缘。

- 材质配置启用 `AdditiveBlending`,形成更亮的粒子叠加效果。

仿真更新模型:每帧 CPU 循环

当前粒子运动(重力、阻力、边界反弹、重生)都在 JS `for` 循环中执行。  

这使逻辑直观易控,但也带来一个关键瓶颈:**粒子数线性增长时,CPU 计算和属性回写成本同步上升。


核心代码

1. **粒子总量入口**

   - `private const int ParticleCount = 100000;`

   - 这是压测的直接控制阀,影响所有数组长度和每帧循环规模。

2. **GPU 友好数据准备**

   - `positions / colors / sizes / lifetimes / maxLifetimes` 都是 `Float32Array`。

   - `BufferAttribute` 绑定后由 `THREE.Points` 进行一次性批量绘制。

3. **渲染材质与 Shader**

   - `THREE.ShaderMaterial({...})` 挂载 `vertexShader` 与 `fragmentShader`。

   - 开启 `transparent + AdditiveBlending + depthWrite:false`,确保粒子叠加效果。

4. **每帧更新与提交**

   - `updateParticles(deltaTime)` 内遍历全部粒子更新状态。

   - 更新后设置:

     - `particles.geometry.attributes.position.needsUpdate = true`

     - `particles.geometry.attributes.lifetime.needsUpdate = true`

   - 这一步会触发 GPU 侧缓冲同步,粒子越多,带宽与提交压力越大。

5. **桌面侧 FPS 可观测性**

   - 页面端每秒 `postMessage('FPS: ' + fps)`。

   - C# 侧 `WebMessageReceived` 更新 `txtFPS.Text`。

   - 这让测试过程具备了稳定的在线观测能力。


实测结果

1 万粒子: FPS 145 , 非常流畅 ;

10 万粒子: FPS 53 ,流畅 ;

50 万粒子: FPS 14 ,明显卡顿 ;

100 万粒子: FPS 7,严重卡顿,接近不可用 ;


性能分析

1. 为什么 1 万到 10 万仍能跑得动?

- WebGL 批量绘制能力较强,点精灵渲染天然适合并行。

- 数据结构使用 `BufferGeometry`,减少了对象级 draw call。

- Shader 逻辑相对轻量,没有复杂纹理采样或后处理。

2. 为什么到 50 万、100 万会急剧下滑?

核心原因不是“GPU 不能画点”,而是**CPU + 数据传输 + GPU 渲染**三者叠加后的总成本爆炸:

- **CPU O(N) 更新成本**:每帧遍历所有粒子,计算速度、位置、碰撞、重生。

- **缓冲更新成本**:`position/lifetime` 每帧都标记 `needsUpdate`,意味着大体量数据频繁上传。

- **像素填充压力**:粒子数量增大后,叠加混合(Additive)会显著增加片段处理负担。

- **浏览器容器开销**:WebView2 本质是嵌入式浏览器,不是纯原生图形管线,存在额外调度成本。

3. 从数据看当前实现的可用区间

- **推荐实时区间**:1 万 ~ 10 万(视业务目标而定)。

- **风险区间**:>10 万 后帧率明显衰减,尤其在复杂效果叠加时。

- **极限演示区间**:几十万到百万可以“展示数量级”,但不适合交互型实时动画。


总结

1. 它验证了 `WebView2 + Three.js + WebGL` 路线在桌面应用中的**可行性**。  

2. 它给出了当前实现的**性能基线**:10 万以内可用,数十万后显著下降,百万级不可实时。  

3. 它说明了后续优化的重点不只是“继续堆 GPU”,而是要系统处理**CPU 更新模型与数据上传路径**。  

从这个演示效果,我们看到three.js的性能仅仅是opentk(opengl)的1/10 (https://blog.ZEEKLOG.net/LateFrames/article/details/158291013?spm=1001.2014.3001.5501), 可以看出来明显的区别:

Read more

3步搞定海尔智能家居集成:HomeAssistant海尔设备连接终极方案

3步搞定海尔智能家居集成:HomeAssistant海尔设备连接终极方案 【免费下载链接】haier 项目地址: https://gitcode.com/gh_mirrors/ha/haier 想要将家中的海尔智能设备完美接入HomeAssistant系统?海尔智能家居集成正是您需要的解决方案!这个强大的集成插件能够将您的海尔智家设备无缝连接到智能家居平台,实现真正的全屋智能控制。 🎯 为什么您的智能家居需要海尔集成 设备兼容性全面覆盖 从空调到热水器,从窗帘到各类开关,海尔智能家居集成理论上支持所有海尔智家设备。无论您使用的是海尔U+平台的哪款智能产品,都能通过这个集成轻松接入HomeAssistant。 配置简单易上手 通过直观的配置向导,即使是智能家居新手也能在几分钟内完成设备连接。无需编写复杂代码,只需几个简单步骤就能享受智能控制带来的便利。 🚀 快速部署海尔集成到HomeAssistant 方法一:HACS一键安装(推荐) 如果您已经安装了HACS,这是最便捷的安装方式。系统会自动处理所有依赖关系和后续更新,确保您始终使用最新版本。 方法二:手动

如何快速实现无人机RemoteID合规?ArduRemoteID开源方案完整指南

如何快速实现无人机RemoteID合规?ArduRemoteID开源方案完整指南 【免费下载链接】ArduRemoteIDRemoteID support using OpenDroneID 项目地址: https://gitcode.com/gh_mirrors/ar/ArduRemoteID ArduRemoteID是一个专为无人机设计的开源RemoteID解决方案,基于OpenDroneID标准实现,完美支持FAA与欧盟法规要求。通过MAVLink和DroneCAN协议与飞行控制器通信,提供WiFi广播、蓝牙5等多种传输模式,兼容ESP32-S3/C3等主流硬件平台,帮助开发者轻松实现无人机身份识别功能。 🚁 项目核心功能解析 多协议兼容的身份发射系统 ArduRemoteID模块集成了MAVLink与DroneCAN双协议支持,可无缝对接ArduPilot等主流飞控系统。通过RemoteIDModule/transmitter.cpp实现的发射逻辑,能同时广播无人机位置、速度、高度等关键飞行数据,确保监管平台实时获取设备状态。 全平台硬件适配方案 支持ESP3

2025年睿抗机器人开发者大赛CAIP-编程技能赛-本科组(国赛)解题报告 | 珂学家

2025年睿抗机器人开发者大赛CAIP-编程技能赛-本科组(国赛)解题报告 | 珂学家

前言 题解 2025年睿抗机器人开发者大赛CAIP-编程技能赛-本科组(国赛)解题报告 睿抗一如既往的码量大,喜欢阅读理解挖坑,T_T。 T3 应该是最简单,如果去掉匹配串 2 字节的限制,感觉会是一道有趣的题。 RC-u1 谁拿冠军了? 分值: 15分 考察点:hash表的使用 注意点:明明某一天里,可能存在多个相同操作,需要求其总和,在除 2。 #include<bits/stdc++.h>usingnamespace std;intmain(){int n, m; cin >> n >> m;int A1, A2, B1,

吃透 AM32 无人机电调:从源码架构到工作原理的全方位解析(附实践指南)(上)

开篇:为什么要深度剖析 AM32 电调? 作为多旋翼无人机的 “动力心脏”,电调(电子调速器)的性能直接决定了无人机的飞行稳定性、响应速度和续航能力。而 AM32 系列电调凭借开源性、高性价比、适配性强三大优势,成为了开源无人机社区的热门选择 —— 从入门级的 2204 电机到专业级的 2306 电机,从 3S 锂电池到 6S 高压电池,AM32 都能稳定驱动。 但很多开发者和爱好者在接触 AM32 源码时,常会陷入 “看得懂代码,看不懂逻辑” 的困境:为什么 FOC 算法要做坐标变换?DShot 协议的脉冲怎么解析?保护机制是如何实时触发的? 这篇博客将从硬件基础→源码架构→模块解析→工作原理→实践操作五个维度,逐行拆解 AM32 电调固件源码,帮你彻底搞懂