小米&杭电 ParkGaussian：首个泊车场景 3D 高斯重建算法

综述由AI生成小米汽车联合杭州电子科技大学提出 ParkGaussian 框架，这是首个将 3D 高斯泼溅融入泊车场景重建的方案。研究构建了包含四台环视鱼眼相机数据的基准数据集 ParkRecon3D，并提出车位感知重建策略，利用车位检测器增强关键区域合成质量。实验表明该方法在重建质量和下游车位检测任务对齐度上均优于现有方法，解决了地下停车场无 GPS 信号及复杂几何结构的挑战，为自动泊车系统提供了可靠的仿真工具。

并发大师发布于 2026/2/5更新于 2026/5/316K 浏览

ParkGaussian：首个面向泊车场景的 3D 高斯泼溅重建方案

论文链接：https://arxiv.org/abs/2601.01386 项目主页：https://github.com/wm-research/ParkGaussian

高斯泼溅的风，刮到了自驾的每个角落。

小米汽车联合杭州电子科技大学在泊车场景重建中提出了 ParkGaussian。相比英伟达 3DGUT 和 OmniRe 提升挺大。

泊车是自动驾驶系统（ADS）的关键任务，在车位拥挤且无 GPS 信号的环境中面临独特挑战。现有研究主要集中于二维车位感知、建图与定位，而三维重建领域的探索仍显不足——该技术对于捕捉泊车场景中的复杂空间几何结构至关重要。单纯提升重建泊车场景的视觉质量并不能直接助力自动泊车，因为泊车系统的核心入口是车位感知模块。

为解决这些局限，小米汽车联合杭州电子科技大学构建了首个专为泊车场景重建设计的基准数据集 ParkRecon3D，其包含来自四台已完成外参标定的环视鱼眼相机的传感器数据，以及密集的车位标注信息。在此基础上，本文提出了 ParkGaussian 框架，这是首个将 3D 高斯 Splatting（3DGS）融入泊车场景重建的方案。为进一步提升重建结果与下游车位检测任务的对齐度，本文引入了车位感知重建策略，利用现有泊车感知方法增强车位区域的合成质量。在 ParkRecon3D 上的实验表明，ParkGaussian 实现了最先进的重建质量，且能更好地保障下游任务的感知一致性。

一、背景回顾

自动泊车是自动驾驶系统（ADS）的重要组成部分。与通常在结构化且具备 GPS 信号的环境中进行的道路行驶不同，泊车场景往往发生在狭窄的地下空间、拥挤的车位以及昏暗的光照条件下。这些因素给精准感知与定位带来了挑战，凸显了针对泊车场景研发专用技术的必要性。

早期研究主要聚焦于泊车感知，尤其是车位检测，旨在通过环视图像识别并定位车位。这些方法通常采用逆透视映射（IPM）将多视角鱼眼图像转换为鸟瞰图（BEV）表示，进而实现车位感知。在这些检测模块的基础上，后续研究探索了泊车场景下的同步定位与地图构建（SLAM）技术——车位地标被用作可靠参考，以提升无 GPS 信号、视觉特征重复环境中的定位鲁棒性。近年来，部分研究提出了端到端框架，可从传感器输入中联合学习感知、规划与控制能力，并基于在 CARLA 仿真器中采集的仿真泊车数据集进行训练。

尽管这些方法在仿真泊车规划任务中表现有效，但 CARLA 仿真器与真实泊车环境之间仍存在较大差距。这一差距表明，需要一个高保真仿真器来评估复杂泊车场景下的车位感知与闭环规划性能。

为弥合仿真与真实环境之间的鸿沟，近期研究日益关注通过四维场景建模实现真实驾驶仿真，包括针对道路级场景的重建与生成方法。在重建领域，早期方法基于神经辐射场（NeRF）构建街道场景表示，开启了驾驶环境重建的初步探索，但这些方法存在效率低下的问题。基于 3D 高斯 Splatting（3DGS）的最新研究显著提升了渲染速度，其通过框监督或自监督方式实现动态街道场景的建模。在生成领域，基于扩散模型与可控生成框架的最新模型可根据场景布局或文本描述合成街道场景。

这些方法在典型的道路行驶场景中实现了照片级的合成质量。在此基础上，部分研究进一步开发了强化学习流水线与闭环仿真系统，用于自动驾驶系统的训练与评估。

然而，现有驾驶仿真器主要聚焦于道路行驶场景建模，而对泊车场景仿真的探索仍较为匮乏。此外，以往的重建方法过分强调视觉保真度，却忽视了仿真的核心目标——生成与感知对齐的合成数据，以真实评估下游模型的性能与局限。对于自动泊车而言，车位检测模块是系统的核心入口，因此确保车位相关区域的视觉保真度与下游感知模型的对齐至关重要。

为解决这些问题，本文首先构建了名为 ParkRecon3D 的基准数据集（图 1），专为泊车场景重建设计。该数据集基于 AVM-SLAM 的开源数据集扩展而来，包含在地下停车场中由四台已标定鱼眼相机采集的传感器数据。ParkRecon3D 提供了超过 4 万帧同步传感器数据和 6 万个车位标注，且所有相机均完成外参标定。基于该基准数据集，本文提出了 ParkGaussian 框架——首个适配环视鱼眼图像的 3D 高斯 Splatting 重建方案，可实现高质量的泊车场景三维重建。此外，本文引入了车位感知重建策略，通过两种广泛使用的车位检测方法（DMPR-PS 和 GCN-Parking）以可学习的方式识别车位区域。该策略不仅提升了车位区域的合成质量，还增强了与下游感知任务的对齐性，为自动泊车系统提供了可靠的仿真工具。

文章配图

本文的主要贡献如下：

构建了首个专为泊车场景三维重建设计的基准数据集 ParkRecon3D，包含来自地下停车场的超过 4 万帧同步鱼眼传感器数据、6 万个精确标注的车位以及已标定的外参信息。

小米&杭电 ParkGaussian：首个泊车场景 3D 高斯重建算法

ParkGaussian：首个面向泊车场景的 3D 高斯泼溅重建方案

一、背景回顾

更多推荐文章

相关免费在线工具

二、ParkGaussian 方法详解

ParkRecon3D 基准数据集

预备知识

3D 高斯泼溅

基于 UT 的投影 3D 高斯泼溅

可微分环视逆透视映射

车位感知重建

停车角点引导

车位边缘感知扩展

训练

光度渲染损失

对齐损失

车位感知重建损失

总损失

三、实验结果分析

实验设置

主要结果

新视图合成

停车位检测

车位感知策略的消融实验

四、当前局限

五、结论

更多推荐文章

相关免费在线工具

小米&杭电 ParkGaussian：首个泊车场景 3D 高斯重建算法

ParkGaussian：首个面向泊车场景的 3D 高斯泼溅重建方案

一、背景回顾

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

二、ParkGaussian 方法详解

ParkRecon3D 基准数据集

预备知识

3D 高斯泼溅

基于 UT 的投影 3D 高斯泼溅

可微分环视逆透视映射

车位感知重建

停车角点引导

车位边缘感知扩展

训练

光度渲染损失

对齐损失

车位感知重建损失

总损失

三、实验结果分析

实验设置

主要结果

新视图合成

停车位检测

车位感知策略的消融实验

四、当前局限

五、结论

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具