YOLO11 驱动的无人机航拍小目标检测系统实战 | 极客日志

PythonAI算法

YOLO11 驱动的无人机航拍小目标检测系统实战

YOLO11 结合 VisDrone 数据集实现无人机航拍小目标检测，配套 PyQt6 桌面应用支持图片、视频及摄像头实时推理。通过提升输入分辨率至 1280 并开启多尺度训练优化小目标精度，提供完整训练参数配置与可视化分析工具，覆盖从数据标注到模型部署的全流程。

Eee_123发布于 2026/3/21更新于 2026/6/2420 浏览

项目背景与概述

无人机航拍图像通常存在目标尺度小、密集分布及多尺度混合等特点，传统检测算法往往难以取得理想效果。本项目基于 Ultralytics YOLO11 框架，在 VisDrone 2019 数据集上进行训练与优化，实现了对行人、车辆等 10 类交通相关目标的高效检测。此外，我们还配套开发了基于 PyQt6 的桌面应用，支持图片、视频及摄像头的实时检测与训练指标可视化，便于模型验证与日常使用。

数据集准备

数据概况

我们选用 VisDrone 2019-DET 数据集，该数据集由天津大学机器学习与数据挖掘实验室 AISKYEYE 团队发布，是面向无人机视角目标检测的大规模基准数据集。其包含超过 260 万个边界框，涵盖 288 个视频片段和 10,209 张静态图像，格式均为 JPEG。

子集	图像数量	说明
训练集 (train)	6,471 张	用于模型训练
验证集 (val)	548 张	用于超参数调优与模型选择
测试集 (test-dev)	1,610 张	含标注，可进行论文实验与结果发布

目标类别

数据集预定义了 10 个类别，涵盖了常见的交通参与者：

类别 ID	英文名称	中文名称
0	pedestrian	行人
1	people	人群
2	bicycle	自行车
3	car	小汽车
4	van	面包车
5	truck	卡车
6	tricycle	三轮车
7	awning-tricycle	带篷三轮车
8	bus	公交车
9	motor	摩托车

数据特点

地理位置：覆盖中国 14 个不同城市，场景跨度大。
小目标特性：航拍高度较高，大量目标归一化后宽度或高度小于 2%。
密集分布：交通路口、人行道等场景中目标密集，遮挡严重。
多尺度混合：同一张图像中存在近大远小现象。

目录结构

dataset_visdrone/
├── data.yaml                 # YOLO 数据集配置文件
├── data_local.yaml           # 自动生成，含本机绝对路径
├── 数据集介绍.md             # 数据集说明文档
├── VisDrone2019-DET-train/   # 训练集
│   ├── images/
│   └── labels/
├── VisDrone2019-DET-val/     # 验证集
│   ├── images/
│   └── labels/
└── VisDrone2019-DET-test-dev/ # 测试集
    ├── images/
    └── labels/

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

python train_yolo11.py                      # 默认配置训练
python train_yolo11.py --model yolo11m      # 指定模型大小
python train_yolo11.py --epochs 200         # 指定训练轮数
python train_yolo11.py --imgsz 1280         # 更大分辨率（小目标更佳）
python train_yolo11.py --multi_scale        # 开启多尺度训练
python train_yolo11.py --mode val --weights runs/train/exp/weights/best.pt
python train_yolo11.py --mode predict --weights runs/train/exp/weights/best.pt --source path/to/image

参数	默认值	说明
`--model`	yolo11s	模型：yolo11n/s/m/l/x
`--epochs`	300	训练轮数
`--imgsz`	640	输入图像尺寸（小目标建议 1280）
`--batch`	16	批大小
`--lr0`	0.01	初始学习率
`--lrf`	0.01	最终学习率比例
`--patience`	100	Early stopping 等待轮数
`--device`	""	GPU 编号或 cpu
`--workers`	4	DataLoader 工作进程数
`--project`	runs/train	实验保存目录
`--name`	yolo11_visdrone	实验名称
`--multi_scale`	False	多尺度训练
`--copy_paste`	0.0	Copy-paste 数据增强概率

参数	默认值	说明
`conf_threshold`	0.25	置信度阈值
`iou_threshold`	0.70	NMS IoU 阈值
`max_det`	300	单张图像最大检测数量

类别	技术
GUI 框架	PyQt6
深度学习框架	Ultralytics (YOLO11)
检测模型	YOLO11s + EMBSFPN + TADDH + C3K2 + PMSFA（改进模型）
后端	PyTorch (ultralytics)
图像处理	OpenCV, Pillow
可视化	matplotlib, pandas
数据处理	numpy, pandas

PyQt6>=6.4.0
ultralytics>=8.0.0
opencv-python>=4.7.0
Pillow>=9.0.0
matplotlib>=3.7.0
numpy>=1.23.0
pandas>=1.5.0
pyyaml

c124/
├── train_yolo11.py          # YOLO11 训练脚本
├── README.md                # 项目说明文档
├── dataset_visdrone/        # 数据集目录
│   ├── data.yaml
│   ├── data_local.yaml
│   ├── 数据集介绍.md
│   ├── VisDrone2019-DET-train/
│   ├── VisDrone2019-DET-val/
│   └── VisDrone2019-DET-test-dev/
├── detection_app/           # 检测系统应用
│   ├── main.py              # 应用入口
│   ├── login_window.py      # 登录窗口
│   ├── main_window.py       # 主窗口
│   ├── config.json          # 应用配置
│   ├── requirements.txt     # 依赖列表
│   ├── data/                # 数据存储
│   │   ├── users.json
│   │   └── history.json
│   ├── pages/               # 页面模块
│   │   ├── image_page.py
│   │   ├── video_page.py
│   │   ├── camera_page.py
│   │   ├── history_page.py
│   │   ├── model_page.py
│   │   └── metrics_page.py
│   └── utils/               # 工具模块
│       ├── detector.py
│       ├── storage.py
│       └── styles.py
├── 训练文件 1/                # 训练输出示例
│   └── exp-yolo11s-EMBSFPN-TADDH-C3K2_PMSFA/
│       ├── args.yaml
│       ├── results.csv
│       ├── results.png
│       └── weights/
└── runs/                    # 训练输出目录（默认）
    └── detect/runs/train/yolo11_visdrone/

@article{zhu2021detection,
  title={Detection and tracking meet drones challenge},
  author={Zhu, Pengfei and Wen, Longyin and Du, Dawei and Bian, Xiao and Fan, Heng and Hu, Qinghua and Ling, Haibin},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  volume={44},
  number={11},
  pages={7380--7399},
  year={2021},
  publisher={IEEE}
}

YOLO11 驱动的无人机航拍小目标检测系统实战

项目背景与概述

数据集准备

数据概况

目标类别

数据特点

目录结构

更多推荐文章

相关免费在线工具

标注格式

训练流程

脚本说明

基本步骤

命令示例

关键参数建议

训练参数详解

主要配置

优化策略

检测参数（应用配置）

可视化分析

训练过程图表

评估指标曲线

results.csv 字段说明

桌面应用功能

核心模块

启动与配置

技术栈

依赖包

项目结构

参考资料

更多推荐文章

相关免费在线工具

YOLO11 驱动的无人机航拍小目标检测系统实战

项目背景与概述

数据集准备

数据概况

目标类别

数据特点

目录结构

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

标注格式

训练流程

脚本说明

基本步骤

命令示例

关键参数建议

训练参数详解

主要配置

优化策略

检测参数（应用配置）

可视化分析

训练过程图表

评估指标曲线

results.csv 字段说明

桌面应用功能

核心模块

启动与配置

技术栈

依赖包

项目结构

参考资料

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具