海下垃圾清理机器人环境感知与障碍物识别系统
本数据集为海下垃圾清理机器人环境感知任务提供训练支持,包含 4485 张经过预处理的水下环境图像,采用 YOLOv8 格式进行标注。数据集分为训练集、验证集和测试集三个部分,所有图像均经过自动方向调整并统一拉伸至 640×60 像素尺寸,未应用任何图像增强技术。数据集共包含三个类别:bucket(桶)、gate(门)和 obstacle(障碍物)。该数据集采用 CC BY 4.0 许可证授权。
目标检测技术背景
目标检测作为计算机视觉的核心任务之一,在过去十年里经历了飞速发展。从传统的 R-CNN 系列到如今的 YOLO 系列,各种创新模型层出不穷。一个典型的目标检测系统需要解决两个核心问题:在哪里(定位)和是什么(分类)。
def detect_objects(image, model):
processed_img = preprocess(image)
detections = model(processed_img)
final_detections = post_process(detections)
return final_detections
YOLO 系列模型演进
YOLOv3 与 YOLOv5
YOLOv3 引入了多尺度预测和更深的 Darknet-53 骨干网络。YOLOv5 引入了自动增强和多尺度训练,生态系统完善,提供了从训练到部署的全套工具链。
YOLOv8
YOLOv8 带来了 Anchor-Free 检测头、Task-Aligned Assigner 和动态任务分配,代表了当前目标检测技术的最高水平。
YOLO13-C3k2-WDBB 算法改进
通道与空间注意力模块
通道注意力模块能够自动学习不同通道的重要性。主要包括全局平均池化和全局最大池化操作,使用全连接层学习每个通道的权重。空间注意力模块关注特征图的空间位置信息,通过卷积层生成空间注意力图。两者结合形成 CBAM 注意力机制。
代码实现
在 /models/ 目录下添加 CBAM.yaml 配置文件,定义网络结构。
nc: 80
depth_multiple: 0.33
width_multiple: 0.50
anchors:
- [10,13,16,30,33,23]
backbone:
- [-1,1, Conv,[64,6,2,2]]
- [-1,, ,[]]
[,, ,[]]

