跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

改进 YOLOv11n 提升无人机红外小目标检测精度与效率

综述由AI生成针对无人机红外图像中小目标尺度小、对比度低导致的漏检问题,提出改进 YOLOv11n 方案。通过新增 P2 检测层、构建双向多分支辅助特征金字塔网络(BIMAFPN)、引入动态注意力检测头(DyHead)及组合损失函数,增强微小目标表征与定位稳定性。在 HIT-UAV 数据集测试中,mAP50 达 92.8%,较基线提升 2.2%,在保持轻量化的同时显著提升了检测精度与召回率,适用于安防监控等场景。

奶糖兔发布于 2026/3/30更新于 2026/6/818 浏览
改进 YOLOv11n 提升无人机红外小目标检测精度与效率

背景与挑战

在无人机红外巡检的实际应用中,目标往往尺度很小,且图像对比度低、边界模糊。这导致常规模型容易出现漏检或定位不准的情况。为了解决这些问题,我们对 YOLOv11n 进行了针对性的架构优化。

核心改进方案

增强小目标感知能力

原生的 YOLOv11n 在处理极小目标时存在短板。我们在颈部网络前增加了一个 P2 小目标检测层(特征图分辨率提升至 160 × 160),让模型能捕获更细微的细节,显著提升召回率。

文章配图

双向多分支特征融合

为了强化浅层细节与高层语义的协同,我们构建了双向多分支辅助特征金字塔网络(BIMAFPN)。通过自顶向下和自底向上的双向交互,配合并行多分支横向连接,利用可学习权重自适应融合各层特征。这种设计增强了模型在复杂背景下的特征分离能力和鲁棒性。

文章配图

文章配图

动态注意力检测头

检测头阶段常出现'尺度选择不准'的问题。引入动态注意力检测头(DyHead)后,模型能从尺度、空间与通道三个维度协同建模。它自适应地重加权不同信息,形成统一高效的表示,在控制推理开销的同时有效降低误检。

文章配图

组合损失函数

针对低重叠区域回归梯度稀疏的问题,我们采用了 NWD-Inner-MPDIoU 组合损失函数。它在低交并比条件下提供连续且尺度稳健的几何度量,按重叠程度自适应缩放边界框,提高了训练稳定性和收敛速度。

实验环境与结果

实验基于哈尔滨工业大学发布的 HIT-UAV 数据集,使用 PyTorch 框架在 NVIDIA GeForce RTX 4090 上进行加速。系统环境为 Ubuntu 22.04,Python 3.10.15,CUDA 12.1。训练参数设置为总轮数 300,批量大小 16,初始学习率 0.01。

消融实验显示,随着 P2 层、BIMAFPN、组合损失及 DyHead 的逐步加入,模型性能稳步提升。最终方案在 HIT-UAV 数据集上的 mAP50 达到 92.8%,相比基线模型提升了 2.2%。召回率和准确率分别提高了 1.6% 和 0.6%。参数量与计算量虽有小幅增加,但整体仍保持在轻量级范畴,适合部署。

文章配图

文章配图

总结

这套改进方案在保证效率的前提下,有效解决了无人机红外小目标检测中的漏检与定位不稳问题。后续工作可以考虑结合剪枝、量化进一步压缩模型,或引入时间一致性增强复杂场景下的泛化能力。

目录

  1. 背景与挑战
  2. 核心改进方案
  3. 增强小目标感知能力
  4. 双向多分支特征融合
  5. 动态注意力检测头
  6. 组合损失函数
  7. 实验环境与结果
  8. 总结
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 大模型 LLM 学习路线图全面解析与核心技能指南
  • Python 数据分析入门:集中趋势与离散程度实战
  • MySQL 详细安装与配置完整教程
  • 数据结构基础:单向链表实现与原理
  • AI 全自动科研系统与 AIGC 动画电影的技术突破与架构解析
  • 哈希表原理与 C++ 实战实现
  • 开源智慧云智能教育平台:支持 Web、App 及小程序全端覆盖
  • 现代 C++ 中 noexcept 声明的适用场景与核心优势
  • 酒店行业 AI 智能客服:提升接通率与降低人力成本方案
  • Java 基本数据类型详解:类型、范围及转换规则
  • 利用 AI 插件实现自然语言到 SQL 的转换实战
  • 密集城市环境无人机空对地路径损耗研究与 Matlab 实现
  • Linux 进程 fork 写时拷贝机制与常见退出方式
  • 使用 GANs 对抗 Web 防火墙(WAF)技术解析
  • 在飞书中接入 OpenClaw 打造专属 AI 助手
  • 双指针算法实战:移动零、复写零与快乐数
  • 如何两个月内提升漏洞挖掘能力成为独立渗透人员
  • 基于 C++ 手写 HTTP 服务器:从请求解析到响应构建
  • 前端开发三年职业历程回顾:理想与现实的碰撞
  • 华为诺亚发布 PixArt-Σ:基于 DiT 架构的 0.6B 4K 文生图模型

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online