PythonAI算法

YOLO11 驱动的无人机航拍小目标检测系统实战

本项目利用 YOLO11 框架解决无人机航拍场景下的小目标检测难题。基于 VisDrone 2019 数据集训练模型，支持行人、车辆等 10 类目标识别。配套开发 PyQt6 桌面应用，实现图片、视频及摄像头的实时检测与结果可视化。重点优化了图像尺寸与多尺度训练策略，提升小目标精度，提供完整的工程化落地方案。

PentesterX发布于 2026/4/10更新于 2026/7/2141 浏览

YOLO11 驱动的无人机航拍小目标检测系统实战

YOLO11 驱动的无人机航拍小目标检测系统实战

针对无人机航拍场景下小目标密集、尺度变化大的痛点，本项目基于 Ultralytics YOLO11 框架，在 VisDrone 2019 数据集上完成了模型训练与优化，并配套开发了 PyQt6 桌面应用。支持图片、视频及摄像头的实时检测，同时提供完整的训练指标可视化功能。

项目背景

航拍图像中目标往往占据像素极少，且存在严重遮挡和多尺度混合问题，传统算法效果有限。我们采用 YOLO11 系列模型，结合 VisDrone 数据集，实现了对行人、车辆等 10 类交通相关目标的高效检测。这套方案不仅包含训练脚本，还封装了可直接使用的桌面端工具，方便日常验证与部署。

数据集准备

数据概况

使用 VisDrone 2019-DET 数据集，这是面向无人机视角的大规模基准数据集。主要划分如下：

子集	图像数量	说明
训练集 (train)	6,471 张	用于模型训练
验证集 (val)	548 张	用于超参数调优与模型选择
测试集 (test-dev)	1,610 张	含标注，可进行论文实验与结果发布

总标注框超过 260 万个，涵盖城市、乡村等多种环境。值得注意的是，大量目标归一化后宽度或高度小于 2%，这对分辨率提出了更高要求。

类别定义

数据集包含 10 个预定义类别，涵盖了常见的交通参与者：

类别 ID	英文名称	中文名称
0	pedestrian	行人
1	people	人群
2	bicycle	自行车
3	car	小汽车
4	van	面包车
5	truck	卡车
6	tricycle	三轮车
7	awning-tricycle	带篷三轮车
8	bus	公交车
9	motor	摩托车

目录结构

建议按以下结构组织文件，确保路径配置正确：

dataset_visdrone/
├── data.yaml # YOLO 数据集配置文件
├── data_local.yaml # 自动生成，含本机绝对路径
├── 数据集介绍.md
├── VisDrone2019-DET-train/
│   ├── images/
│   └── labels/
├── VisDrone2019-DET-val/
│   ├── images/
│   └── labels/
└── VisDrone2019-DET-test-dev/
    ├── images/
    └── labels/

标注格式遵循 YOLO 标准，每行一个目标：<class_id> <x_center> <y_center> <width> <height>，坐标均为归一化值 [0, 1]。

# 默认配置训练
python train_yolo11.py 

# 指定模型大小（m 版本平衡速度与精度）
python train_yolo11.py --model yolo11m 

# 指定训练轮数（VisDrone 收敛较慢，建议 200+）
python train_yolo11.py --epochs 200 

# 提升小目标检测能力，增大分辨率
python train_yolo11.py --imgsz 1280 

# 开启多尺度训练，增强泛化性
python train_yolo11.py --multi_scale 

# 验证模型
python train_yolo11.py --mode val --weights runs/train/exp/weights/best.pt 

# 推理预测
python train_yolo11.py --mode predict --weights runs/train/exp/weights/best.pt --source path/to/image

参数	默认值	说明
`--model`	yolo11s	模型：yolo11n/s/m/l/x
`--epochs`	300	训练轮数
`--imgsz`	640	输入图像尺寸（小目标建议 1280）
`--batch`	16	批大小
`--lr0`	0.01	初始学习率
`--lrf`	0.01	最终学习率比例
`--patience`	100	Early stopping 等待轮数
`--device`	""	GPU 编号或 cpu
`--workers`	4	DataLoader 工作进程数
`--project`	runs/train	实验保存目录
`--name`	yolo11_visdrone	实验名称
`--multi_scale`	False	多尺度训练
`--copy_paste`	0.0	Copy-paste 数据增强概率

模块	功能说明
图片识别	支持 JPG/PNG/BMP，拖拽导入，导出检测结果图片与 CSV
视频识别	支持 MP4/AVI/MOV，逐帧检测并显示进度
摄像头识别	实时调用本地摄像头进行目标检测
检测历史	查看所有历史记录，支持筛选与导出
模型管理	管理模型文件路径，调整置信度、IoU 阈值等参数
指标展示	展示训练过程的可视化指标

PyQt6>=6.4.0
ultralytics>=8.0.0
opencv-python>=4.7.0
Pillow>=9.0.0
matplotlib>=3.7.0
numpy>=1.23.0
pandas>=1.5.0

c124/
├── train_yolo11.py # YOLO11 训练脚本
├── README.md # 项目说明文档
├── dataset_visdrone/ # 数据集目录
│   ├── data.yaml
│   ├── VisDrone2019-DET-train/
│   └── ...
├── detection_app/ # 检测系统应用
│   ├── main.py
│   ├── login_window.py
│   ├── main_window.py
│   ├── config.json
│   ├── requirements.txt
│   ├── data/
│   │   ├── users.json
│   │   └── history.json
│   ├── pages/ # 各功能页面
│   │   ├── image_page.py
│   │   ├── video_page.py
│   │   ├── camera_page.py
│   │   ├── history_page.py
│   │   ├── model_page.py
│   │   └── metrics_page.py
│   └── utils/
│       ├── detector.py
│       ├── storage.py
│       └── styles.py
├── 训练文件 1/ # 训练输出示例
│   └── exp-yolo11s-EMBSFPN-TADDH-C3K2_PMSFA/
│       ├── args.yaml
│       ├── results.csv
│       ├── weights/
│       └── ...
└── runs/ # 默认训练输出目录
    └── train/yolo11_visdrone/

@article{zhu2021detection,
  title={Detection and tracking meet drones challenge},
  author={Zhu, Pengfei and Wen, Longyin and Du, Dawei and Bian, Xiao and Fan, Heng and Hu, Qinghua and Ling, Haibin},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  volume={44},
  number={11},
  pages={7380--7399},
  year={2021},
  publisher={IEEE}
}

更多推荐文章

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online