
近年来,随着无人机技术的快速发展和低空经济政策的推进,无人机在智慧城市、交通巡检、应急救援等领域的应用日益广泛。然而,无人机的智能化离不开高质量视觉数据的支持。那么,当前有哪些公开的低空视觉数据集?它们又如何分类、有何特点?未来又将如何发展?
本文系统梳理近 11 年来低空无人机视觉数据集的发展脉络,为研究人员与应用开发者提供清晰的认知框架与实践参考。

一、低空视觉数据集:为什么如此重要?
低空视觉感知是无人机获取环境信息、实现自主决策的关键技术。无论是目标检测、跟踪、语义分割,还是无人机自主导航与协同作业,都离不开大量高质量、多样化的标注数据。
公开数据集的发布,不仅推动了算法研究的标准化,也降低了研究门槛,加速了技术落地。然而,随着任务复杂化和场景多元化,单一类型的数据已难以满足需求。因此,系统梳理现有数据集,明确其特点与适用场景,显得尤为重要。

二、五大维度解析低空视觉数据集
论文提出了一套基于设备类型、任务需求、模态类型、环境特性、应用需求五大方向的分类体系,全面覆盖低空视觉数据集的构建逻辑与应用场景。
设备类型:单机 vs 多机
- 单机数据集:由单一无人机采集,视角固定,适用于特定场景下的目标检测、跟踪等任务。代表数据集包括 VisDrone、UAV123、AnimalDrone 等。
- 多机协同数据集:由多架无人机协同采集,覆盖多视角、跨场景,适用于立体安防、广域监测等高可靠性任务。代表数据集有 MDOT、CoPerception-UAVs、MAVREC 等。


展示了 DOTA、SDD、DroneVehicle 等数据集的典型图像,涵盖白天与夜间场景。
任务需求:单任务 vs 多任务
- 单一任务数据集:专注如车辆检测、行人跟踪等单一任务,标注粒度集中。如 VEDAI、COWC 等。
- 多任务数据集:支持目标检测、跟踪、计数、行为分析等多个任务,标注信息更丰富。如 VisDrone、DroneCrowd、UAV-Human 等。

















