YOLOv8 无人机航拍小目标检测实战

引言

随着无人机技术的普及，航拍图像在农业监测、城市规划及灾害评估中的应用越来越广。但在这些场景中，车辆、行人等小目标往往占比极低，且受分辨率和复杂背景影响，传统算法很难兼顾速度与精度。YOLO（You Only Look Once）系列凭借高推理速度和良好的平衡性，成为实时检测的首选。从 2015 年提出至今，YOLOv8 在架构和部署效率上都有了显著优化。

我们重点探讨 YOLOv8 在无人机航拍场景下的小目标检测实践，涵盖环境配置、数据准备、模型训练到推理优化的全流程，并针对漏检问题提供可落地的改进策略。

YOLOv8 核心特性与适用性

架构演进

YOLOv8 由 Ultralytics 团队开发，相比早期版本做了多项关键升级：

无 Anchor 设计：采用动态标签分配机制（如 Task-Aligned Assigner），提升正负样本匹配质量。
高效主干与颈部：使用 CSPDarknet 变体结合 PAN-FPN，融合多尺度特征。
增强数据增强：集成 Mosaic、MixUp、Copy-Paste 等，对小目标学习更友好。
模块化选型：支持 n/s/m/l/x 多种尺寸，方便根据硬件资源灵活调整。

YOLOv8.3 进一步优化了检测头设计，增强了对浅层特征的利用，在高空航拍图像中表现更佳。

小目标检测难点

航拍图中的小目标通常像素面积小于 32×32，占比不足整图的 0.1%，且常混入草地、道路等相似背景。这导致标准设置下容易出现漏检或误检，必须结合场景针对性优化。

开发环境搭建

镜像选择

推荐使用基于 Docker 封装的计算机视觉开发环境，预装 PyTorch 1.13+ CUDA 11.7，内置 ultralytics 官方库，并集成 Jupyter Lab 与 SSH 远程访问功能。这种方式能极大简化依赖配置，适合快速验证原型。

启动与连接

启动容器后，可通过浏览器访问 Jupyter 界面进行调试，或直接通过 SSH 连接终端执行脚本：

ssh root@<服务器 IP> -p 2222

登录后可直接监控 GPU 状态或运行训练任务。

实战流程

数据集准备

选用 VisDrone2019 或 DIOR-R 等公开航拍数据集，包含人、自行车、汽车等类别。目录结构需遵循 Ultralytics 标准：

dataset/
├── images/
│   ├── train/
│   └── val/
├── labels/
│   ├── train/
│   └── val/
└── data.yaml

data.yaml 配置示例：

train: /root/dataset/images/train
val: /root/dataset/images/val
nc: 8
names: ['pedestrian', 'people', 'bicycle', 'car', 'van', , , ]

参数	推荐值	作用
`imgsz`	640 或 1280	提高输入分辨率有助于捕捉小目标细节
`mosaic`	0.5~1.0	多图拼接增强小目标出现频率
`copy_paste`	0.3	将小目标复制粘贴至新位置，缓解样本稀疏问题
`close_mosaic`	10	前几轮关闭马赛克以稳定收敛

模型配置	[email protected]	小目标 [email protected]	推理速度 (FPS)	显存占用 (GB)
YOLOv8n (640)	0.421	0.287	142	3.2
YOLOv8n (1280)	0.463	0.352	68	7.1
YOLOv8n + Copy-Paste	0.478	0.376	65	7.3
YOLOv8s (1280)	0.491	0.394	52	8.0

YOLOv8 无人机航拍小目标检测实战