YOLO26：实时目标检测的关键架构改进与性能基准测试

摘要

本文深入剖析了 Ultralytics YOLO26 在实时边缘目标检测领域的关键架构改进与性能表现。作为 YOLO 系列最新模型，YOLO26 于 2025 年 9 月发布，专为边缘设备和低功耗场景设计，兼顾高效能与高精度。文章重点阐述了其架构创新，包括移除分布焦点损失（DFL）、采用端到端无 NMS 推理、集成渐进式损失（ProgLoss）和小目标感知标签分配（STAL），以及引入 MuSGD 优化器以实现稳定收敛。除核心架构外，该研究将 YOLO26 定位为多任务框架，支持目标检测、实例分割、姿态估计、旋转检测和分类。我们在 NVIDIA Jetson Nano 和 Orin 等边缘设备上进行了性能基准测试，并与 YOLOv8 至 v13 及基于 Transformer 的检测器进行了对比。此外，还探讨了实时部署路径、灵活的导出选项（ONNX、TensorRT、CoreML、TFLite）以及 INT8/FP16 量化方案，展示了其在机器人、制造业和物联网等领域的实际价值。

关键词：YOLO26·边缘人工智能·多任务目标检测·无 NMS 推理·小目标识别·目标检测·MuSGD 优化器

1 引言

目标检测是计算机视觉的核心任务之一，使机器能够在图像或视频流中定位并分类多个对象。从自动驾驶到工业质检，实时目标检测算法构成了 AI 应用的重要支柱。在众多算法中，'你只看一次'（YOLO）系列凭借准确性与推理速度的平衡，成为最具影响力的实时检测模型。自 2016 年推出以来，YOLO 历经多次迭代，不断解决前代局限并整合前沿进展。2025 年 9 月发布的 YOLO26 标志着这一进化历程的最新里程碑，引入了架构简化、新型优化器和增强的边缘部署能力。

表 1 梳理了从 YOLOv1 到 YOLOv13 及 YOLO26 的模型演变，涵盖发布年份、关键架构创新、支持任务及开发框架。

模型（年份）	关键架构创新与贡献	任务	框架
YOLOv1（2015）	首个统一的单阶段目标检测器	目标检测、分类	Darknet
YOLOv2（2016）	引入多尺度训练；锚框维度聚类优化	目标检测、分类	Darknet
YOLOv3（2018）	深层骨干网络，残差连接；SPP 模块	多尺度目标检测	Darknet
YOLOv4（2020）	Mish 激活函数；CSPDarknet-53 骨干	目标检测、跟踪	Darknet
YOLOv5（2020）	PyTorch 实现；无锚框检测头；SiLU 激活	目标检测、分割	PyTorch
YOLOv6（2022）	高效 Rep 骨干；自注意力机制	目标检测、分割	PyTorch
YOLOv7（2022）	扩展 ELAN；模型重参数化	目标检测、跟踪、分割	PyTorch
YOLOv8（2023）	C2f 骨干；解耦头；全无锚框设计	检测、分割、关键点	PyTorch
YOLOv9（2024）	可编程梯度信息（PGI）；G-ELAN	检测、分割	PyTorch
YOLOv10（2024）	一致的双分配训练；端到端无 NMS	目标检测	PyTorch
YOLOv11（2024）	C3k2 CSP 瓶颈；C2PSA 模块	检测、分割、姿态、旋转	PyTorch
YOLOv12（2025）	区域注意力模块；残差 ELAN	目标检测	PyTorch

YOLO26：实时目标检测的关键架构改进与性能基准测试