背景
在城市交通管理体系中,精准掌握道路车辆的分布与流量是优化通行效率、缓解拥堵的核心前提。传统的地面监测设备存在覆盖范围有限、易被遮挡等局限,难以实现大范围、动态的交通态势感知。
随着无人机技术的成熟,其高空视角与灵活部署能力成为城市交通监测的重要补充手段。基于计算机视觉的车辆识别算法可从无人机航拍图像中提取交通数据,但这类算法的性能高度依赖高质量的标注数据集。本次介绍的无人机航拍车辆识别检测数据集,正是为满足这一技术需求构建,旨在为算法研发提供贴近真实城市交通场景的训练样本。
该数据集覆盖了城市交通的典型环境:包含白天、黄昏、夜间等不同时段的光照变化,以及路口、主干道等复杂场景,模拟了从高空视角观察到的真实视觉挑战,能够帮助算法更好地应对现实中的干扰因素,提升检测的鲁棒性。
数据详情
整体规模
本数据集共包含2708 张图像文件,均为 JPG 格式;配套的标注文件总数为2709 份,图像与标注文件比例接近 1:1,保证了数据与标注的高度匹配。所有标注文件采用 YOLO 格式的 TXT 文件,每个标注文件对应一张图像,记录了车辆区域的边界框坐标与类别信息。类别包括 "PMT"、"articulated-bus"(铰接式巴士)、"bus"(巴士)、"car"(小型轿车)、"freight"(货运车)、"motorbike"(摩托车)、"small-bus"(小型巴士)、"truck"(货车)共 8 类。
子集划分
数据集按照算法训练与评估的需求,划分为三个子集:
- 训练集:包含 1710 张图像与 1710 份标注文件,总文件数为 3420,是模型训练的核心数据来源,为算法提供了大量基础样本以学习车辆特征规律。
- 验证集:包含 558 张图像与 558 份标注文件,总文件数为 1116,用于在训练过程中评估模型的泛化能力,帮助研发人员调整算法参数,避免过拟合。
- 测试集:包含 440 张图像与 440 份标注文件,总文件数为 880,用于在模型训练完成后评估最终性能,验证算法在未知样本上的识别精度。
存储结构
数据集采用清晰的目录分层结构,便于算法开发时的调用与管理:
- 根目录下仅包含 1 份统计文件,用于记录数据集的整体概况;
train/images、valid/images、test/images目录分别存储训练集、验证集与测试集的图像文件;train/labels、valid/labels、test/labels目录对应存储训练集、验证集与测试集的 YOLO 格式标注文件。
这种结构符合主流的计算机视觉数据集规范,能够无缝对接 YOLO 系列等主流检测算法的训练框架,降低了算法开发的适配成本。
数据特征
从样本图像来看,数据集覆盖了多样化的城市交通场景:包含不同车型、不同密度的车流,且图像中存在自然的阴影干扰、车辆遮挡与背景复杂的城市环境,模拟了真实高空监测中的视觉条件。标注的 8 类车辆涵盖了城市道路常见的车型,其中'铰接式巴士''货运车'等大型车辆的标注,为模型学习不同尺度车辆的视觉特征提供了准确的监督信息。





