
ST-GS: 基于时空高斯泼溅的视觉 3D 语义占用预测论文笔记
ST-GS 方法通过引入时空信息增强基于高斯的占用预测范式,用于视觉驱动的 3D 语义占用预测。该方法利用共享图像编码器提取多视图特征,生成 3D 高斯嵌入作为查询。核心模块包括指导性空间聚合(GISA),通过高斯指导注意力(GGA)和视图指导注意力(VGA)实现 2D 特征与 3D 嵌入的桥梁;门控空间特征聚合(GSFA)动态平衡两种注意力贡献。此外,几何感知时间融合(GATF)显式对齐跨帧高斯嵌入并选择性聚合历史信息,增强时间一致性…









