Ultralytics YOLO 演进:YOLO26、YOLO11、YOLOv8 和 YOLOv5 目标检测器在计算机视觉与模式识别中的概述
Ultralytics YOLO 演进YOLO26、YOLO11、YOLOv8 和 YOLOv5 目标检测器在计算机视觉与模式识别中的概述作者Ranjan Sapkota, Manoj Karkee单位康奈尔大学生物与环境工程系纽约州伊萨卡市14850美国日期2025年10月16日摘要本文全面概述了 Ultralytics YOLO 系列目标检测器重点介绍架构演进、基准测试、部署视角和未来挑战。本综述从最新发布的 YOLO26或 YOLOv26开始该版本引入了多项关键创新移除分布焦点损失DFL、原生无NMS推理、渐进损失平衡ProgLoss、小目标感知标签分配STAL以及用于稳定训练的 MuSGD 优化器。随后追溯演进历程YOLO11 采用混合任务分配和效率导向模块YOLOv8 以解耦检测头和无锚框预测实现进步YOLOv5 则奠定了模块化 PyTorch 基础使现代 YOLO 开发成为可能。在 MS COCO 数据集上的基准测试提供了 YOLOv5、YOLOv8、YOLO11 和 YOLO26 的详细定量比较以及与 YOLOv12、YOLOv13、RT-DETR 和 DEIM 的交叉对比。分析了包括精确率、召回率、F1分数、平均精度均值和推理速度在内的指标以突出精度与效率之间的权衡。进一步讨论了部署和应用视角涵盖导出格式、量化策略以及在机器人、农业、监控和制造业中的实际应用。最后论文识别了挑战和未来方向包括密集场景限制、混合 CNN-Transformer 集成、开放词汇检测和边缘感知训练。关键词YOLO · Ultralytics · YOLOv5 · YOLOv8 · YOLO11 · YOLO26 · You Only Look Once1 引言目标检测已成为计算机视觉中最关键的任务之一使机器不仅能够识别还能在复杂图像或视频流中定位多个目标[1,2]。其重要性涵盖广泛的领域包括自动驾驶、机器人、监控、医学成像、农业和智能制造在这些领域中可靠的实时性能直接关系到安全性、效率和自动化收益[3,4]。在过去十年提出的众多算法中YOLOYou Only Look Once你只看一次系列已成为最具影响力和最广泛采用的实时目标检测模型系列在高精度和前所未有的推理速度之间取得了平衡[5]。自2016年首次发布以来YOLO 经历了多次架构修订每次迭代都解决了前代的特定限制同时融入了神经网络设计、训练策略、损失函数和部署效率方面的进展[5]。YOLO 的累积演进如图1所示该图追溯了从早期 Ultralytics 版本如 YOLOv5到最新 YOLO262025年的转变后者是第一个原生统一五项关键任务的版本目标检测、实例分割、分类、姿态/关键点检测和定向边界框检测。该时间线展示了 YOLO 如何稳步扩展其检测之外的能力成为一个适用于研究和边缘部署的多功能多任务视觉框架。2025年9月发布的 YOLO26 代表了这一演进轨迹的最新里程碑。YOLO26 围绕简洁、高效和创新的原则设计引入了架构简化消除了非极大值抑制NMS和分布焦点损失DFL等瓶颈采用新颖的 MuSGD 优化器实现稳定收敛并纳入了渐进损失平衡ProgLoss和小目标感知标签分配STAL等训练改进[6]。这些创新共同确立了 YOLO26 作为针对低功耗和嵌入式设备优化的尖端模型在不牺牲准确性的情况下显著提高了实际部署能力。为了将 YOLO26 置于更广泛的生态系统中我们首先回顾 Redmon 等人2016年开创的范式转变他们将检测重新定义为单个回归问题放弃区域提议转而支持边界框和类别概率的直接一次性预测[7]。与将提议生成和分类解耦的两阶段流程如 R-CNN 和 Faster R-CNN[8,9]相比YOLO 设计实现了实时吞吐量同时保持了具有竞争力的准确性使 YOLOv1 对包括机器人和自主导航在内的延迟关键领域具有吸引力[10,11]。随后快速迭代YOLOv22017年引入了批归一化、锚框和多尺度训练以增强跨目标尺度的鲁棒性[12]YOLOv32018年加深了骨干网络Darknet-53并利用多尺度特征图建立了学术界和工业界广泛采用的基线[13,14,5,15]。随着航空成像、农业和医学分析等领域对准确性需求的增长架构变得多样化。YOLOv42020年整合了 CSPNet、改进的激活函数和高级训练策略如马赛克增强、CIoU[16]。Ultralytics 的 YOLOv52020年普及了原生 PyTorch 模块化工具链便于适应分割、分类和边缘部署。随后的社区版本YOLOv6、YOLOv7集成了参数高效模块和受 Transformer 启发的模块在保持实时推理的同时推动准确性提升[17,18]。Ultralytics 随后使用 YOLOv8解耦头、无锚框预测[19,20]、YOLOv9GELAN、渐进蒸馏[21]、YOLOv10延迟平衡分配[22] 和 YOLO11效率与强小目标性能[5] 重新架构了技术栈。并行的非 Ultralytics 系列 YOLOv12 和 YOLOv13 追求以注意力为中心的设计多头自注意力、改进融合、更强正则化但仍依赖 NMS 和 DFL在低功耗设备上造成延迟和导出摩擦[23,24]。针对这些瓶颈YOLO26 推进了部署优先的理念它移除 DFL采用端到端无NMS推理并引入 ProgLoss 和 STAL 以实现稳定性和小目标保真度同时通过 MuSGD 加速训练。图1总结了这一轨迹并明确了 YOLO26 作为第一个原生统一目标检测、实例分割、分类、姿态/关键点检测和定向边界框的 Ultralytics 版本。本文旨在提供对 Ultralytics 如何将 YOLO 系列塑造成当前形态 culminating in YOLO26的整合理解。通过系统比较这四个里程碑版本本综述不仅强调了架构创新还背景化了性能权衡、基准测试结果和部署就绪性。在此过程中它阐述了 YOLO 从快速但有限的检测器发展为多功能、多任务、边缘优化框架的更广泛叙述该框架继续在研究和工业领域为实时目标检测设定标准。2 Ultralytics YOLO 模型的架构演进为了提供精确的时间顺序和架构背景我们将 Ultralytics 维护的版本与社区驱动的变体分开。表1列出了 Ultralytics 系列 YOLOv52020年、YOLOv82023年、YOLO112024年和 YOLO262025年突出单一供应商家族内的设计选择、能力和部署特征。相比之下表2调查了独立于 Ultralytics 的主要社区驱动版本包括 YOLOv12015年、YOLOv22016年、YOLOv32018年、YOLOv42020年、YOLOv62022年、YOLOv72022年、YOLOv92024年和 YOLOv102024年以及其他当代变体。这些表格共同呈现了架构创新、任务扩展和性能趋势的年表视图阐明了该框架如何成熟到 YOLO26 所代表的状态表1和表2。表1Ultralytics YOLO 模型关键架构创新、任务和框架表格模型年份关键架构创新与贡献任务框架YOLOv5 (2020)Ultralytics 首个 PyTorch 实现取代 Darknet引入 SiLU 激活和 PANet 颈部以改进特征聚合灵活的无锚框头通过现代训练工具、增强和导出选项使 YOLO 易于使用目标检测、有限实例分割PyTorchYOLOv8 (2023)下一代 Ultralytics 重新设计C2f 骨干网络实现轻量级表示解耦检测头改进收敛完全无锚框设计引入跨检测、分割、姿态/关键点和全景任务的任务统一强大的开源生态系统集成目标检测、实例分割、全景分割、关键点估计PyTorchYOLO11 (2024)主要 Ultralytics 里程碑添加 C3k2 CSP 瓶颈提高效率C2PSA 模块CSP 空间注意力实现鲁棒特征聚焦将 YOLO 系列从检测/分割扩展到包括姿态估计和定向边界框目标检测、实例分割、姿态估计、定向检测PyTorchYOLO26 (2025)边缘优化旗舰通过原生端到端预测器消除 NMS移除 DFL 实现更快导出和更简单回归引入 ProgLoss渐进损失平衡和 STAL小目标

相关新闻

Dr. MAS:多智能体LLM系统的稳定强化学习训练方案

Dr. MAS:多智能体LLM系统的稳定强化学习训练方案

Dr. MAS:多智能体LLM系统的稳定强化学习训练方案 多智能体大语言模型系统通过角色专业化实现高级推理和工具使用,但如何对其进行可靠的强化学习后训练仍是一个巨大挑战。南洋理工大学的研究团队从理论上 pinpoint 了将群体强化学习扩展到多智能体LLM系统…

2026/5/17 1:25:01 阅读更多 →
(七)RT-Thread物联网实战--MQTT-cJSON-OneNET

(七)RT-Thread物联网实战--MQTT-cJSON-OneNET

RT-Thread物联网实战 — MQTT cJSON OneNET云平台 前言 设备联网之后,如何将数据上传到云平台并实现远程监控?本文将串联MQTT协议、Paho MQTT库、cJSON数据解析以及OneNET云平台,构建完整的物联网数据链路:传感器 → MCU → ESP…

2026/7/4 4:19:45 阅读更多 →
有无相生的螺旋:AI时代人类进化的五个维度

有无相生的螺旋:AI时代人类进化的五个维度

有无相生的螺旋:AI时代人类进化的五个维度 系列第一篇:觉醒-从有到无《从“有生于无“到“熵减者“:一个技术人对AI时代的跨学科思考》 系列第二篇:有无相生的螺旋 从阴阳辩证到宇宙自我认知 题记 当AI掌握了"有"&am…

2026/7/4 3:38:41 阅读更多 →

最新新闻

x64dbg:Windows 逆向分析的开源调试器

x64dbg:Windows 逆向分析的开源调试器

文章目录x64dbg:Windows 逆向分析的开源调试器它能干什么为什么逆向圈都在用1. 填补了工具断层2. 插件生态起来了3. 真正的开源底层技术栈实际体验我的建议x64dbg:Windows 逆向分析的开源调试器 搞逆向工程的人都知道,调试器是吃饭的家伙。I…

2026/7/5 9:06:34 阅读更多 →
告别过时文档:用敏捷方法论+AI知识库实现实时文档最佳实践

告别过时文档:用敏捷方法论+AI知识库实现实时文档最佳实践

告别过时文档:用敏捷方法论AI知识库实现实时文档最佳实践我经常和产品团队的同事聊文档管理,发现一个普遍困境:要么文档写得像百科全书,没人看;要么干脆不写,后期维护成本爆表。其实,好的文档策…

2026/7/5 9:04:33 阅读更多 →
CTinspector架构深度解析:揭秘256字节轻量级Packet VM的设计奥秘

CTinspector架构深度解析:揭秘256字节轻量级Packet VM的设计奥秘

CTinspector架构深度解析:揭秘256字节轻量级Packet VM的设计奥秘 【免费下载链接】CTinspector multipule nodes ebpf flow inspector, initialed by CTyun 项目地址: https://gitcode.com/openeuler/CTinspector 前往项目官网免费下载:https://a…

2026/7/5 9:02:33 阅读更多 →
UADK调度器详解:同步与异步模式下的性能优化策略

UADK调度器详解:同步与异步模式下的性能优化策略

UADK调度器详解:同步与异步模式下的性能优化策略 【免费下载链接】uadk 项目地址: https://gitcode.com/openeuler/uadk 前往项目官网免费下载:https://ar.openeuler.org/ar/ UADK(User-space Accelerator Development Kit&#xff…

2026/7/5 9:02:33 阅读更多 →
openeuler/opensource-intern项目研究结果深度剖析:关键发现与应用价值

openeuler/opensource-intern项目研究结果深度剖析:关键发现与应用价值

openeuler/opensource-intern项目研究结果深度剖析:关键发现与应用价值 【免费下载链接】opensource-intern This reposiroty will provide the content of openEuler opensource intern. 项目地址: https://gitcode.com/openeuler/opensource-intern 前往项…

2026/7/5 9:00:33 阅读更多 →
如何在openEuler上快速部署Ceph开发环境:ceph_dev项目5步入门指南

如何在openEuler上快速部署Ceph开发环境:ceph_dev项目5步入门指南

如何在openEuler上快速部署Ceph开发环境:ceph_dev项目5步入门指南 【免费下载链接】ceph_dev ceph_dev is a project focus on some feature developing based on ceph 项目地址: https://gitcode.com/openeuler/ceph_dev 前往项目官网免费下载:h…

2026/7/5 9:00:33 阅读更多 →

日新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻