无人机视觉目标检测数据集 VisDrone 介绍
随着无人机技术的飞速发展,其在航拍、监控、农业、物流等领域的应用日益广泛。与此同时,无人机视角下的视觉任务,如目标检测、目标跟踪和场景理解,也成为了计算机视觉研究的热点。然而,相比传统的地面视角数据集,无人机视角下的图像具有高度变化、小目标密集、复杂背景等独特挑战,这对现有算法提出了更高的要求。
为了应对这些挑战并推动无人机视觉技术的发展,天津大学机器学习与数据挖掘实验室推出了 VisDrone 数据集。作为一个大规模、标注精细的无人机视觉数据集,VisDrone 不仅涵盖了丰富的场景和多样化的目标类别,还为研究人员提供了一个极具挑战性的测试平台。该数据集采集自中国 14 个不同城市,覆盖复杂城市场景、交通枢纽、密集人群等多种环境。

数据集下载与结构
VisDrone 官方 Github 下载渠道:
https://github.com/VisDrone/VisDrone-Dataset?tab=readme-ov-file
下载的数据集包含以下部分(均含有标注):
- 训练集:6,471 张图像 (VisDrone2019-DET-train)
- 验证集:548 张图像 (VisDrone2019-DET-val)
- 测试集:1,610 张图像 (VisDrone2019-DET-test-dev)
注:VisDrone2019-DET-test-challenge 不含标注,通常用于竞赛评估,不在常规处理范围内。
数据格式转换
下载下来的原始数据集为 jpg + txt 文件,这里的 txt 不是 YOLO 训练可用的 txt 文件,需要对数据处理后才能使用。
忽略区域处理
官方共有 12 个分类,其中 ignored regions 为忽略的区域。有些区域包含了密集的很小的目标,无法进行标注,因此需要将这部分内容从图片中覆盖白色方块进行遮挡。

带有白色方块及标注框的效果如下:

类别定义
others 忽略掉,因此转换后的类别共有 10 类,分别为:
["pedestrian", "people",




