🎯 框架定位
MMDetection3D 是 OpenMMLab 生态中专注于3D 目标检测、3D 语义分割、多模态感知的工业级框架,支持点云、单/多视角图像、多传感器融合等输入,广泛适配自动驾驶、机器人导航、工业质检等场景。其模块化设计(Backbone→Neck→Head)与 MMSegmentation 完全对齐,可快速复用 2D 生态的成熟模块。
🔧 一、MMDetection3D 所有核心 Backbone(骨干网络)
Backbone 是 3D 感知的特征提取核心,负责从原始 3D 数据(点云/体素/图像)中提取底层特征,支持三类骨干,所有 Backbone 均可在配置文件中通过 backbone: 字段直接调用,部分支持预训练权重加载。
1. 点云专用 Backbone(3D 特征提取核心)
专为点云稀疏性、无序性设计的骨干,是 3D 感知的基础核心。
| Backbone | MMDetection3D 配置标识 | 核心特点 | 适配场景 |
|---|---|---|---|
| PointNet++ | PointNet2Backbone | 多尺度分组(MSG/SG),融合局部 + 全局特征,点云分割/检测的经典基线 | 3D 语义分割、小目标检测 |
| PVCNN | PVCNNBackbone | 体素化 + 稀疏卷积,高效处理大规模点云,算力 - 精度平衡优秀 | 大场景 3D 检测、自动驾驶 |
| PointPillars | PointPillarsBackbone | 点云柱式编码(Pillarization),将点云转为伪图像,适配 2D CNN 加速推理 | 实时 3D 检测、自动驾驶部署 |
| DGCNN | DGCNNBackbone | 动态图卷积建模点云邻域关联,特征表达能力强于 PointNet++ | 高精度 3D 分割、学术研究 |
| PointTransformer | PointTransformerBackbone | 自注意力机制建模长距离特征关联,精度超传统 CNN,算力稍高 | 高精度 3D 分割、学术研究 |
| PAConv | PAConvBackbone | 位置感知动态图卷积,动态调整邻域关联,分割精度 SOTA | 高精度 3D 分割、工业级验证 |
2. 图像复用 Backbone(多模态融合基础)
直接复用 MMSegmentation 的 2D 骨干,用于多模态检测中的图像特征提取,配置标识与 MMSeg 完全一致。
| Backbone | 配置标识 | 核心特点 | 适配场景 |
|---|---|---|---|
| ResNet | ResNet/ResNetV1c | 残差连接解决梯度消失,V1c 为分割优化版,支持空洞卷积改造 | 多模态检测、图像特征增强 |
| SwinTransformer | SwinTransformer | 窗口自注意力 + 层级融合,全局感受野强,适配 BEV 感知算法 | 多模态 BEV 检测、高精度场景 |
| MobileNetV3 | MobileNetV3 |


