一、引言
YOLO(You Only Look Once)作为一种非常流行的目标检测算法,以其高效和准确性而闻名。YOLOv8 作为这一系列算法较新颖的版本,相较于其前身在准确性、速度和模型大小方面都有所改进。本文介绍发表在《Industrial Crops and Products》(中科院 1 区 TOP)的 CPD-YOLO 方法,说明 YOLOv8 模型在跨平台(无人机 + 手机)场景下的棉花病虫害多尺度目标检测中的应用。主要改进点如下:
- 特征融合改善:构建 Bi-FPN + RepTransformer 网络,实现多尺度特征的高效融合与推理加速。
- 检测头增加:设计 4 头动态检测网络,赋予模型多维动态感知能力。
- 损失函数优化:提出 Inner-Shape IoU 边界框回归损失函数,提升定位精度,同时加速模型收敛。
论文原文:https://doi.org/10.1016/j.indcrop.2025.121515 代码仓库:https://github.com/xfl-521/GW_Y_YOLO
二、研究背景
棉花是一种重要的经济作物,也是世界范围内纺织品的主要原料。棉花种植期间主要面临病虫害的侵袭,威胁棉花生长发育,引发产量骤减,严重削弱棉花的商品属性和市场竞争力。病虫害的侵袭会导致棉花叶片细胞结构中的色素、水分、营养元素等性质发生变化,这种变化会反映在棉叶图像信息中,如颜色和形态。近年来,随着深度学习的发展,以 YOLO 系列模型为代表的目标检测算法,因其检测精度高、泛化能力和鲁棒性强等优势在作物病虫害诊断中应用广泛。因此,研发基于 YOLO 的棉叶病虫害检测方法有望为棉农提供移动互联新兴形势下的田间棉叶病虫害精确检测服务,助力棉花产业高质量发展。
三、数据集
(一)数据获取与标注
采用大疆 Mavic3 无人机和荣耀 9 手机采集了蚜虫、双斑萤叶甲和褐斑病侵袭下的棉叶图像数据,其中无人机图像分辨率为 4000×3000 像素,手机图像为 3968×2976 像素。随后对图像进行人工标注,生成包含病虫害位置及类别信息。
部分数据集:https://huggingface.co/datasets/Fukang2000/CPD_YOLOGWY/tree/main
(a) 无人机图像
(b) 智能手机图像
图 1 棉花病虫害图数据标注示例
四、模型改进
-
RepViT-BiFPN:在 RepViT block 中采用了结构重参数化技术,以提高模型在训练期间的学习效率,并在推理期间减少计算和内存成本。采用跨块方式放置挤压 - 激励(SE)层,以最大化准确性收益,同时最小化延迟增加。
-
DyHead:设计动态检测头,增强模型对不同尺度目标的适应能力。
-
Inner-IoU:对于高 IoU 的样本,使用较小的辅助边界框来计算损失可以加快收敛,而低 IoU 的样本则更适合使用较大尺寸的辅助边界框。基于此 Inner-IoU 应运而生,它通过辅助边界框来计算 IoU 损失。
-
Shape-IoU:Shape-IoU 通过引入形状和尺度感知因子,改进了传统 IoU 的计算方式,使其能够更准确反映边界框之间的真实相似度,提高小目标的检测精度,增强模型对不规则形状目标的适应性。


图 2 改进的 YOLOv8 模型结构图


