1. 数据集简介
DroneVehicle 是由天津大学收集并标注的大型无人机航拍车辆数据集。该数据集包含 56,878 幅图像,其中一半为 RGB 图像,另一半为红外图像。我们对五个类别进行了带有方向性边界框的丰富标注:
- Car (汽车): RGB 389,779 个标注,红外 428,086 个
- Truck (卡车): RGB 22,123 个标注,红外 25,960 个
- Bus (公交车): RGB 15,333 个标注,红外 16,590 个
- Van (面包车): RGB 11,935 个标注,红外 12,708 个
- Freight Car (货车): RGB 13,400 个标注,红外 17,173 个
2. 数据预处理
原始图片四周有宽度为 100 像素的白色边框,导致下载的图片尺寸为 840 x 712。为了适配 YOLO 训练要求,我们需要去除白边并将图像尺寸调整为 640 x 512。

处理前后的对比效果如上所示。下面是去除白边的 Python 脚本,逻辑很简单,直接裁剪坐标区域即可:
import numpy as np
import cv2
import os
from tqdm import tqdm
def create_file(output_dir_vi, output_dir_ir):
if not os.path.exists(output_dir_vi):
os.makedirs(output_dir_vi)
if not os.path.exists(output_dir_ir):
os.makedirs(output_dir_ir)
print(f'Created folder: ({output_dir_vi}); ({output_dir_ir})')
def update(input_img_path, output_img_path):
image = cv2.imread(input_img_path)
# 裁剪坐标为 [y0:y1, x0:x1]
cropped = image[100:612, 100:740]
cv2.imwrite(output_img_path, cropped)
dataset_dir_vi = r'valimg'
output_dir_vi =
dataset_dir_ir =
output_dir_ir =
create_file(output_dir_vi, output_dir_ir)
image_filenames_vi = [(os.path.join(dataset_dir_vi, x), os.path.join(output_dir_vi, x)) x os.listdir(dataset_dir_vi)]
image_filenames_ir = [(os.path.join(dataset_dir_ir, x), os.path.join(output_dir_ir, x)) x os.listdir(dataset_dir_ir)]
()
path tqdm(image_filenames_vi):
update(path[], path[])
()
path tqdm(image_filenames_ir):
update(path[], path[])








