YOLO26:实时目标检测的关键架构改进与性能基准测试
摘要
本文深入剖析了 Ultralytics YOLO26 在实时边缘目标检测领域的关键架构改进与性能表现。作为 YOLO 系列最新模型,YOLO26 于 2025 年 9 月发布,专为边缘设备和低功耗场景设计,兼顾高效能与高精度。文章重点阐述了其架构创新,包括移除分布焦点损失(DFL)、采用端到端无 NMS 推理、集成渐进式损失(ProgLoss)和小目标感知标签分配(STAL),以及引入 MuSGD 优化器以实现稳定收敛。除核心架构外,该研究将 YOLO26 定位为多任务框架,支持目标检测、实例分割、姿态估计、旋转检测和分类。我们在 NVIDIA Jetson Nano 和 Orin 等边缘设备上进行了性能基准测试,并与 YOLOv8 至 v13 及基于 Transformer 的检测器进行了对比。此外,还探讨了实时部署路径、灵活的导出选项(ONNX、TensorRT、CoreML、TFLite)以及 INT8/FP16 量化方案,展示了其在机器人、制造业和物联网等领域的实际价值。
关键词:YOLO26·边缘人工智能·多任务目标检测·无 NMS 推理·小目标识别·目标检测·MuSGD 优化器
1 引言
目标检测是计算机视觉的核心任务之一,使机器能够在图像或视频流中定位并分类多个对象。从自动驾驶到工业质检,实时目标检测算法构成了 AI 应用的重要支柱。在众多算法中,'你只看一次'(YOLO)系列凭借准确性与推理速度的平衡,成为最具影响力的实时检测模型。自 2016 年推出以来,YOLO 历经多次迭代,不断解决前代局限并整合前沿进展。2025 年 9 月发布的 YOLO26 标志着这一进化历程的最新里程碑,引入了架构简化、新型优化器和增强的边缘部署能力。
表 1 梳理了从 YOLOv1 到 YOLOv13 及 YOLO26 的模型演变,涵盖发布年份、关键架构创新、支持任务及开发框架。
| 模型(年份) | 关键架构创新与贡献 | 任务 | 框架 |
|---|---|---|---|
| YOLOv1(2015) | 首个统一的单阶段目标检测器 | 目标检测、分类 | Darknet |
| YOLOv2(2016) | 引入多尺度训练;锚框维度聚类优化 | 目标检测、分类 | Darknet |
| YOLOv3(2018) | 深层骨干网络,残差连接;SPP 模块 | 多尺度目标检测 | Darknet |
| YOLOv4(2020) | Mish 激活函数;CSPDarknet-53 骨干 | 目标检测、跟踪 | Darknet |
| YOLOv5(2020) | PyTorch 实现;无锚框检测头;SiLU 激活 | 目标检测、分割 | PyTorch |
| YOLOv6(2022) | 高效 Rep 骨干;自注意力机制 | 目标检测、分割 | PyTorch |
| YOLOv7(2022) | 扩展 ELAN;模型重参数化 | 目标检测、跟踪、分割 | PyTorch |
| YOLOv8(2023) | C2f 骨干;解耦头;全无锚框设计 | 检测、分割、关键点 | PyTorch |
| YOLOv9(2024) | 可编程梯度信息(PGI);G-ELAN | 检测、分割 | PyTorch |
| YOLOv10(2024) | 一致的双分配训练;端到端无 NMS | 目标检测 | PyTorch |
| YOLOv11(2024) | C3k2 CSP 瓶颈;C2PSA 模块 | 检测、分割、姿态、旋转 | PyTorch |
| YOLOv12(2025) | 区域注意力模块;残差 ELAN | 目标检测 | PyTorch |


