1、关于 DroneVehicle 数据集介绍
DroneVehicle 数据集是由天津大学收集、标注的大型无人机航拍车辆数据集。 DroneVehicle 数据集由无人机采集的共 56,878 幅图像组成,其中一半为 RGB 图像,其余为红外图像。我们对五个类别进行了带有方向性边界框的丰富标注。其中,汽车 car 在 RGB 图像中有 389,779 个标注,在红外图像中有 428,086 个标注;卡车 truck 在 RGB 图像中有 22,123 个标注,在红外图像中有 25,960 个标注;公交车 bus 在 RGB 图像中有 15,333 个标注,在红外图像中有 16,590 个标注;面包车 van 在 RGB 图像中有 11,935 个标注,在红外图像中有 12,708 个标注;货车 freight car 在 RGB 图像中有 13,400 个标注,在红外图像中有 17,173 个标注。
2、DroneVehicle 数据集下载
数据集地址:https://github.com/VisDrone/DroneVehicle
3、DroneVehicle 数据集处理
在 DroneVehicle 中,为了标注图片边界上的物体,作者在每张图片的上下左右四边设置了宽度为 100 像素的白色边框,这样下载的图片尺寸就是 840 x 712。在训练我们的检测网络时,我们可以进行预处理,去除周围的白色边框,并将图像尺寸改为 640 x 512。

处理前后对比。
去除白边代码:
import numpy as np
import cv2
import os
from tqdm import tqdm
def create_file(output_dir_vi, output_dir_ir):
if not os.path.exists(output_dir_vi):
os.makedirs(output_dir_vi)
if not os.path.exists(output_dir_ir):
os.makedirs(output_dir_ir)
print(f'Created folder:({output_dir_vi}); ({output_dir_ir})')
def update(input_img_path, output_img_path):
image = cv2.imread(input_img_path)
cropped = image[100:612, 100:740] # 裁剪坐标为 [y0:y1, x0:x1]
cv2.imwrite(output_img_path, cropped)
dataset_dir_vi =
output_dir_vi =
dataset_dir_ir =
output_dir_ir =
create_file(output_dir_vi, output_dir_ir)
image_filenames_vi = [(os.path.join(dataset_dir_vi, x), os.path.join(output_dir_vi, x)) x os.listdir(dataset_dir_vi)]
image_filenames_ir = [(os.path.join(dataset_dir_ir, x), os.path.join(output_dir_ir, x)) x os.listdir(dataset_dir_ir)]
()
path tqdm(image_filenames_vi):
update(path[], path[])
()
path tqdm(image_filenames_ir):
update(path[], path[])









