无人机视觉目标检测数据集 VisDrone 介绍与数据格式转换 | 极客日志

PythonAI算法

无人机视觉目标检测数据集 VisDrone 介绍与数据格式转换

由天津大学推出的 VisDrone 无人机视觉数据集，涵盖航拍、监控等场景。数据集包含训练、验证及测试集，针对无人机视角下的小目标密集、复杂背景等挑战进行了精细标注。文章说明了原始数据需转换为 YOLO 格式，重点讲解了如何处理 ignored regions（通过白色方块遮挡），并列出转换后的 10 个有效类别。同时提供了官方下载链接及数据处理后的效果展示，供目标检测研究参考。

DevOpsTeam发布于 2026/4/6更新于 2026/7/2765 浏览

无人机视觉目标检测数据集 VisDrone 介绍与数据格式转换

无人机视觉目标检测数据集 VisDrone 介绍

随着无人机技术的飞速发展，其在航拍、监控、农业、物流等领域的应用日益广泛。与此同时，无人机视角下的视觉任务，如目标检测、目标跟踪和场景理解，也成为了计算机视觉研究的热点。然而，相比传统的地面视角数据集，无人机视角下的图像具有高度变化、小目标密集、复杂背景等独特挑战，这对现有算法提出了更高的要求。

为了应对这些挑战并推动无人机视觉技术的发展，天津大学机器学习与数据挖掘实验室推出了 VisDrone 数据集。作为一个大规模、标注精细的无人机视觉数据集，VisDrone 不仅涵盖了丰富的场景和多样化的目标类别，还为研究人员提供了一个极具挑战性的测试平台。该数据集采集自中国 14 个不同城市，覆盖复杂城市场景、交通枢纽、密集人群等多种环境。

VisDrone 数据集示例

数据集下载与结构

VisDrone 官方 Github 下载渠道：

https://github.com/VisDrone/VisDrone-Dataset?tab=readme-ov-file

下载的数据集包含以下部分（均含有标注）：

训练集：6,471 张图像 (VisDrone2019-DET-train)
验证集：548 张图像 (VisDrone2019-DET-val)
测试集：1,610 张图像 (VisDrone2019-DET-test-dev)

注：VisDrone2019-DET-test-challenge 不含标注，通常用于竞赛评估，不在常规处理范围内。

数据格式转换

下载下来的原始数据集为 jpg + txt 文件，这里的 txt 不是 YOLO 训练可用的 txt 文件，需要对数据处理后才能使用。

忽略区域处理

官方共有 12 个分类，其中 ignored regions 为忽略的区域。有些区域包含了密集的很小的目标，无法进行标注，因此需要将这部分内容从图片中覆盖白色方块进行遮挡。

忽略区域遮挡效果

带有白色方块及标注框的效果如下：

带白块标注效果

类别定义

others 忽略掉，因此转换后的类别共有 10 类，分别为：

["pedestrian", "people",