FAST-LIVO2 体素地图：八叉树数据结构深度解析

本文档详细推导 FAST-LIVO2 中基于八叉树的体素地图（VoxelMap）的构建、更新及其在激光–惯性–视觉里程计中用于状态估计的数学原理。该地图将三维空间递归划分为不同分辨率的体素，每个体素内拟合局部平面，并提供点到平面的残差及其不确定性，用于迭代扩展卡尔曼滤波（IEKF）的更新。

1. 八叉树数据结构

地图由一系列根体素（root voxel）组成，每个根体素对应一个固定大小的空间立方体（大小为 voxel_size）。每个根体素内部递归地构建一棵八叉树，树的每个节点 VoxelOctoTree 包含以下关键信息：

层数 layer：根节点为 0，子节点层数递增，最大层数 max_layer_ 限制树的深度。
体素中心 voxel_center_：该节点所代表立方体的几何中心。
半长 quater_length_：立方体边长的一半（即从中心到边界的距离），子节点边长为父节点的一半。
节点状态 octo_state_：标识该节点是否为平面（0）或非平面（1）。非平面节点将继续向下划分。
平面指针 plane_ptr_：指向一个 VoxelPlane 结构，存储拟合的平面参数（法向量、中心、协方差等）。
临时点集 temp_points_：存储尚未触发平面拟合或节点分割的原始点（包含坐标和协方差）。
子节点指针 leaves_[8]：指向八个子节点。

2. 平面拟合与不确定性传播

当某个节点内的点数超过预设阈值 points_size_threshold_ 时，触发平面拟合，计算该节点内所有点的平面参数及其不确定性。

2.1 点云协方差与特征分解

设节点内有 n 个点，每个点的世界坐标为 $\mathbf{p}_i$。首先计算点集的中心：

$$\bar{\mathbf{p}} = \frac{1}{n}\sum_{i=1}^{n} \mathbf{p}_i$$

然后计算协方差矩阵：

$$\mathbf{C} = \frac{1}{n}\sum_{i=1}^{n} (\mathbf{p}_i - \bar{\mathbf{p}})(\mathbf{p}_i - \bar{\mathbf{p}})^\top$$

对 $\mathbf{C}$ 进行特征值分解：

$$\mathbf{C} = \mathbf{V} \mathbf{\Lambda} \mathbf{V}^\top, \quad \mathbf{\Lambda} = \mathrm{diag}(\lambda_1, \lambda_2, \lambda_3), \quad \lambda_1 \le \lambda_2 \le \lambda_3$$

对应的特征向量为 $\mathbf{v}_1, \mathbf{v}_2, \mathbf{v}_3$。

2.2 平面判定与参数提取

若最小特征值 $\lambda_1$ 小于阈值 planer_threshold_，则认为这些点构成一个平面。此时：

法向量 $\mathbf{n}$ 取为最小特征值对应的特征向量：$\mathbf{n} = \mathbf{v}_1$。
平面方程常数项 $d = -\mathbf{n}^\top \bar{\mathbf{p}}$。
平面中心 $\mathbf{c} = \bar{\mathbf{p}}$。
半径 $r = \sqrt{\lambda_3}$（最大特征值反映平面延伸范围）。
另外两个特征向量 $\mathbf{v}_2, \mathbf{v}_3$ 可作为平面内的正交基（用于可视化）。

2.3 平面参数的不确定性传播

平面参数 $\boldsymbol{\theta} = [\mathbf{n}^\top, \mathbf{c}^\top]^\top \in \mathbb{R}^6$ 的不确定性来源于每个点的测量噪声。假设每个点 $\mathbf{p}{\mathbf{p}{\boldsymbol{\theta}}$ 可通过一阶线性传播近似。

FAST-LIVO2 体素地图：八叉树数据结构深度解析