CVPR 2024 论文解读：SuGaR 实现 3DGS 到 Mesh 的高效转换

基本信息

题目：SuGaR: Surface-Aligned Gaussian Splatting for Efficient 3D Mesh Reconstruction and High-Quality Mesh Rendering

来源：CVPR 2024

学校：Univ Gustave Eiffel, CNRS, France

摘要：3DGS 转 Mesh

我们提出了一种方法，可以从 3DGS 中精确和极快地提取 Mesh。3DGS 最近变得非常流行，因为它可以产生逼真的渲染，同时训练速度明显快于 NeRF。然而，从数百万个微小的 3D 高斯中提取网格具有挑战性，因为这些高斯在优化后往往是无组织的，并且迄今为止尚未提出任何方法。我们的第一个关键贡献是一个 regularization term，它鼓励高斯与场景表面很好地对齐。然后，我们介绍了一种方法，该方法利用这种对齐，使用泊松重建从高斯网格中提取网格，该方法快速、可扩展并保留细节，这与通常用于从神经 SDF 中提取网格的行进立方体算法形成鲜明对比。最后，我们引入了一种可选的细化策略，将高斯绑定到网格表面，并通过高斯喷射渲染共同优化这些高斯和网格。这样，通过纵网格体而不是高斯本身，可以轻松编辑、雕刻、动画和重新照明高斯。使用我们的方法在几分钟内即可检索这种可编辑网格以进行逼真的渲染，而使用 SDF 上最先进的方法需要数小时，同时提供更好的渲染质量。

Introduction

1.背景与问题陈述

3D Gaussian Splatting 的兴起：
- 3D Gaussian Splatting 是继 NeRF（Neural Radiance Fields）之后的一种新兴技术，用于捕获 3D 场景并从新视角进行渲染。相比 NeRF，3D Gaussian Splatting 通过优化大量微小 3D 高斯函数（包括位置、方向、外观和透明度）来表示场景，渲染速度更快（几分钟内完成场景捕获），适合实时应用。
- 高斯函数的渲染速度远超 NeRF 的神经场渲染，因为它避免了复杂的体视渲染（volumetric rendering）过程。
核心挑战：
- 在许多计算机图形学工作流中，三角网格是首选的场景表示形式，因为它支持编辑、雕刻、动画和重新光照等操作。然而，从无序的高斯函数中提取高质量的三角网格非常困难，这一问题在 NeRF 中也存在，但原因不同。

尽管 3D Gaussian Splatting 在渲染质量上表现优异，但从优化后的高斯函数中提取场景的表面几何（surface geometry）仍然具有挑战性。优化后的高斯函数通常呈现无序结构，且与实际场景表面不完全对应（见论文中的图 3）。

文章配图

2. 提出的解决方案（SuGaR）

正则化项：
- 作者提出了一种正则化项，鼓励高斯函数在场景表面上均匀分布，从而更好地捕捉场景几何。这种正则化基于假设高斯函数是'平坦的'并均匀分布在表面上，通过最小化计算密度与实际密度的差异来优化高斯函数的分布。
- 这一正则化使得从高斯函数中提取表面几何变得更可行。
- 传统的 Marching Cubes 算法在处理高斯 splatting 的密度函数时效果不佳，因为高斯函数数量庞大（百万级），且大多数高斯函数非常小（用于捕捉纹理和细节），导致密度函数几乎处处接近零，难以提取有效的水平集（level set）。
- 作者提出了一种高效的方法，通过从训练视角的高斯深度图（depth maps）采样水平集上的点，结合 Poisson 重建算法（Poisson Reconstruction）生成三角网格。这种方法具有可扩展性，在单块 GPU 上只需几分钟即可完成，与依赖神经 SDF（Signed Distance Function）的方法（需要 24 小时或多 GPU 加速）相比，效率显著提高。
网格与高斯的联合优化：

在提取网格后，作者提出了一种可选的精炼策略，通过仅使用高斯 splatting 渲染来联合优化网格和一组高斯函数。这种优化使网格不仅适合传统网格编辑工具，还能通过高斯 splatting 渲染实现高质量的视图合成，优于其他基于网格的辐射场模型。