基于 YOLO11 的无人机航拍小目标检测系统实战 | 极客日志

PythonAI算法

基于 YOLO11 的无人机航拍小目标检测系统实战

一个基于 YOLO11 框架的无人机航拍小目标检测系统。项目利用 VisDrone 数据集训练模型，支持行人、车辆等 10 类目标识别。通过 PyQt6 开发了桌面应用，实现图片、视频及摄像头的实时检测与结果可视化。详细记录了从数据准备、模型训练参数配置到系统功能实现的完整流程，为同类小目标检测任务提供可复现的工程实践参考。

清心发布于 2026/3/28更新于 2026/7/2046 浏览

在无人机航拍场景中，小目标检测一直是计算机视觉领域的难点。传统算法往往难以应对目标尺度小、密集分布及多尺度混合等复杂情况。本项目基于 Ultralytics YOLO11 框架，结合 VisDrone 2019 数据集进行训练与优化，并配套开发了基于 PyQt6 的桌面应用，支持图片、视频及摄像头的实时检测与指标可视化。

项目概述

VisDrone 数据集是面向无人机视角目标检测的大规模基准数据集，由天津大学机器学习与数据挖掘实验室 AISKYEYE 团队发布。本项目利用该数据集实现了对行人、车辆等 10 类交通相关目标的高效检测，并通过桌面应用便于模型验证与日常使用。

数据集说明

数据规模

子集	图像数量	说明
训练集 (train)	6,471 张	用于模型训练
验证集 (val)	548 张	用于超参数调优与模型选择
测试集 (test-dev)	1,610 张	含标注，可进行论文实验与结果发布

总标注框数量：超过 260 万个边界框
图像来源：288 个视频片段 + 10,209 张静态图像
图像格式：JPEG (.jpg)

目标类别

数据集包含 10 个预定义类别：

类别 ID	英文名称	中文名称
0	pedestrian	行人
1	people	人群
2	bicycle	自行车
3	car	小汽车
4	van	面包车
5	truck	卡车
6	tricycle	三轮车
7	awning-tricycle	带篷三轮车
8	bus	公交车
9	motor	摩托车

数据集特点

地理位置：覆盖中国 14 个不同城市，相距数千公里
场景类型：涵盖城市、乡村等多种环境
小目标特性：无人机航拍高度较高，大量目标归一化后宽度或高度小于 2%
密集分布：交通路口、人行道等场景中目标密集，遮挡严重
多尺度混合：同一张图像中存在近大远小现象

目录结构

project_root/
├── data.yaml              # YOLO 数据集配置文件
├── data_local.yaml        
├── 数据集介绍.md          
├── VisDrone2019-DET-train/
│   ├── images/            
│   └── labels/            
├── VisDrone2019-DET-val/
│   ├── images/
│   └── labels/
└── VisDrone2019-DET-test-dev/
    ├── images/
    └── labels/

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

python train_yolo11.py                    # 默认配置训练
python train_yolo11.py --model yolo11m    # 指定模型大小
python train_yolo11.py --epochs 200       # 指定训练轮数
python train_yolo11.py --imgsz 1280       # 更大分辨率（小目标更佳）
python train_yolo11.py --multi_scale      # 开启多尺度训练
python train_yolo11.py --mode val --weights runs/train/exp/weights/best.pt
python train_yolo11.py --mode predict --weights runs/train/exp/weights/best.pt --source path/to/image

参数	默认值	说明
`--model`	yolo11s	模型：yolo11n/s/m/l/x
`--epochs`	300	训练轮数
`--imgsz`	640	输入图像尺寸（小目标建议 1280）
`--batch`	16	批大小
`--lr0`	0.01	初始学习率
`--lrf`	0.01	最终学习率比例
`--patience`	100	Early stopping 等待轮数
`--device`	""	GPU 编号或 cpu
`--workers`	4	DataLoader 工作进程数
`--project`	runs/train	实验保存目录
`--name`	yolo11_visdrone	实验名称
`--multi_scale`	False	多尺度训练
`--copy_paste`	0.0	Copy-paste 数据增强概率

参数	默认值	说明
`conf_threshold`	0.25	置信度阈值
`iou_threshold`	0.70	NMS IoU 阈值
`max_det`	300	单张图像最大检测数量

文件	含义
`results.csv`	每 epoch 的损失与指标（训练/验证 loss、mAP、精确率、召回率等）
`results.png`	训练曲线概览，包含损失、mAP、学习率等随 epoch 变化
`train_batch*.jpg`	训练 batch 样本可视化，展示数据增强后的输入图像与标签
`val_batch*_labels.jpg`	验证 batch 的标签可视化
`val_batch*_pred.jpg`	验证 batch 的预测结果可视化

文件	含义
`labels.jpg`	标签分布图，展示各类别目标在图像中的位置与数量分布
`labels_correlogram.jpg`	标签关联图，展示类别间相关性

文件	含义
`confusion_matrix_normalized.png`	归一化混淆矩阵，展示各类别的预测与真实标签对应关系
`P_curve.png`	精确率–置信度曲线，随置信度阈值变化的精确率
`R_curve.png`	召回率–置信度曲线，随置信度阈值变化的召回率
`F1_curve.png`	F1 分数–置信度曲线
`PR_curve.png`	精确率–召回率曲线（PR 曲线）

模块	功能说明
图片识别	支持 JPG/PNG/BMP 等格式，上传图片后点击开始检测，支持拖拽导入，可导出检测结果图片与 CSV
视频识别	支持 MP4/AVI/MOV 等格式，加载视频后逐帧检测，显示进度
摄像头识别	实时调用本地摄像头进行目标检测
检测历史	查看所有历史检测记录，支持筛选与导出
模型管理	管理检测模型文件路径，调整置信度、IoU 阈值等检测参数，验证模型加载
指标展示	展示模型训练过程的各项可视化指标，包括训练曲线、指标汇总、可视化图表

类别	技术
GUI 框架	PyQt6
深度学习框架	Ultralytics (YOLO11)
检测模型	YOLO11s + EMBSFPN + TADDH + C3K2 + PMSFA（改进模型）
后端	PyTorch (ultralytics)
图像处理	OpenCV, Pillow
可视化	matplotlib, pandas
数据处理	numpy, pandas

PyQt6>=6.4.0
ultralytics>=8.0.0
opencv-python>=4.7.0
Pillow>=9.0.0
matplotlib>=3.7.0
numpy>=1.23.0
pandas>=1.5.0

project_root/
├── train_yolo11.py           # YOLO11 训练脚本
├── README.md                 # 项目说明文档
├── dataset_visdrone/         # 数据集目录
│   ├── data.yaml             # 数据集配置
│   ├── data_local.yaml       # 自动生成（本机路径）
│   ├── 数据集介绍.md         # 数据集说明
│   ├── VisDrone2019-DET-train/
│   ├── VisDrone2019-DET-val/
│   └── VisDrone2019-DET-test-dev/
├── detection_app/            # 检测系统应用
│   ├── main.py               # 应用入口
│   ├── login_window.py       # 登录窗口
│   ├── main_window.py        # 主窗口
│   ├── config.json           # 应用配置
│   ├── requirements.txt      # 依赖列表
│   ├── data/
│   │   ├── users.json        # 用户数据
│   │   └── history.json      # 检测历史
│   ├── pages/
│   │   ├── image_page.py     # 图片识别页
│   │   ├── video_page.py     # 视频识别页
│   │   ├── camera_page.py    # 摄像头识别页
│   │   ├── history_page.py   # 检测历史页
│   │   ├── model_page.py     # 模型管理页
│   │   └── metrics_page.py   # 指标展示页
│   └── utils/
│       ├── detector.py       # 检测逻辑
│       ├── storage.py        # 配置与存储
│       └── styles.py         # 界面样式
├── 训练文件 1/                 # 训练输出示例
│   └── exp-yolo11s-EMBSFPN-TADDH-C3K2_PMSFA/
│       ├── args.yaml         # 训练参数快照
│       ├── results.csv       # 训练指标
│       ├── results.png       # 训练曲线
│       └── weights/
│           ├── best.pt       # 最佳权重
│           └── last.pt       # 最后一轮权重
└── runs/                     # 训练输出目录（默认）
    └── detect/runs/train/yolo11_visdrone/

@article{zhu2021detection,
  title={Detection and tracking meet drones challenge},
  author={Zhu, Pengfei and Wen, Longyin and Du, Dawei and Bian, Xiao and Fan, Heng and Hu, Qinghua and Ling, Haibin},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  volume={44},
  number={11},
  pages={7380--7399},
  year={2021},
  publisher={IEEE}
}

基于 YOLO11 的无人机航拍小目标检测系统实战

项目概述

数据集说明

数据规模

目标类别

数据集特点

目录结构

更多推荐文章

相关免费在线工具

标注格式

训练过程

训练脚本

基本流程

使用示例

训练注意事项

训练参数

主要训练参数

模型与优化器

检测参数（应用配置）

可视化图含义

训练过程图表

标签与类别分析

评估指标曲线

results.csv 主要列说明

系统功能

功能模块

入口与流程

配置与存储

项目技术栈

依赖包（detection_app/requirements.txt）

项目结构

参考文献

相关链接

更多推荐文章

相关免费在线工具

基于 YOLO11 的无人机航拍小目标检测系统实战

项目概述

数据集说明

数据规模

目标类别

数据集特点

目录结构

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

标注格式

训练过程

训练脚本

基本流程

使用示例

训练注意事项

训练参数

主要训练参数

模型与优化器

检测参数（应用配置）

可视化图含义

训练过程图表

标签与类别分析

评估指标曲线

results.csv 主要列说明

系统功能

功能模块

入口与流程

配置与存储

项目技术栈

依赖包（detection_app/requirements.txt）

项目结构

参考文献

相关链接

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具