无人机多模态目标检测:高多样性基准数据集与融合方法
综述由AI生成针对无人机可见光与红外图像融合目标检测任务,提出高多样性数据集 ATR-UMOD,覆盖 80m 至 300m 飞行高度及多种天气光照场景,并标注 6 个条件属性。为解决复杂成像条件下的视觉信息瓶颈,设计提示引导的条件感知动态融合(PCDF)方法,利用 CLIP 文本语义编码多标签条件,通过样本特定条件提示学习和条件解耦模块自适应重新分配多模态贡献。实验表明该方法在 ATR-UMOD 上显著优于现有单模态及多模态检测器,提升了跨多样条件的…








