YOLO26最新创新改进系列:主干网络全新设计——EfficientNetV2-BackBone ,引入渐进式学习策略、自适应正则强度调整机制,共同优化训练速度和参数效率,全方位提升模型检测性能!!
YOLO26最新创新改进系列主干网络全新设计——EfficientNetV2-BackBone 引入渐进式学习策略、自适应正则强度调整机制共同优化训练速度和参数效率全方位提升模型检测性能购买相关资料后畅享一对一答疑畅享超多免费持续更新且可大幅度提升文章档次的纯干货工具见文末EfficientNetV2论文地址戳这详细的改进教程以及源码戳这戳这戳这B站AI学术叫叫兽 源码在相簿的链接中动态中也有链接感谢支持祝科研遥遥领先一、EfficientNetV2概述文章摘要本文介绍了一种新的卷积网络EfficientNetV2它具有比之前的模型更快的训练速度和更好的参数效率。为了开发这些模型我们使用了一种训练感知的神经架构搜索和缩放的组合以共同优化训练速度和参数效率。这些模型是从具有新操作如Fused-MBConv的搜索空间中搜索出来的。我们的实验表明EfficientNetV2模型的训练速度比最先进的模型快得多同时体积最大可减小6.8倍。我们可以通过逐步增加训练中的图像尺寸来进一步加速训练但这往往会导致准确度降低。为了补偿这种准确度降低我们提出了一种改进的逐步学习方法它根据图像尺寸自适应地调整正则化例如数据增强。通过逐步学习我们的EfficientNetV2在ImageNet和CIFAR/Cars/Flowers数据集上明显优于以前的模型。通过在相同的ImageNet21k上进行预训练我们的EfficientNetV2在ImageNet ILSVRC2012上实现了87.3%的top-1准确率比最近的ViT高出2.0%的准确率同时使用相同的计算资源训练速度提高了5倍至11倍。通过上图很明显能够看出EfficientNetV2网络不仅Accuracy达到了当前的SOTAState-Of-The-Art水平而且训练速度更快参数数量更少比当前火热的Vision Transformer还要强。EfficientNetV2-XL (21k)在ImageNet ILSVRC2012的Top-1上达到87.3%。在EfficientNetV1中作者关注的是准确率参数数量以及FLOPs理论计算量小不代表推理速度快在EfficientNetV2中作者进一步关注模型的训练速度。1.1 EfficientNetV1中存在的问题1.1.1训练图像的尺寸很大时训练速度非常慢。这确实是个槽点在之前使用EfficientNet时发现当使用到B3img_size300- B7img_size600时基本训练不动而且非常吃显存。通过下表可以看到在Tesla V100上当训练的图像尺寸为380x380时batch_size24还能跑起来当训练的图像尺寸为512x512时batch_size24时就报OOM显存不够了。针对这个问题一个比较好想到的办法就是降低训练图像的尺寸之前也有一些文章这么干过。降低训练图像的尺寸不仅能够加快训练速度还能使用更大的batch_size.1.1.2 在网络浅层中使用Depthwise convolutions速度会很慢。虽然Depthwise convolutions结构相比普通卷积拥有更少的参数以及更小的FLOPs但通常无法充分利用现有的一些加速器虽然理论上计算量很小但实际使用起来并没有想象中那么快。在近些年的研究中有人提出了Fused-MBConv结构去更好的利用移动端或服务端的加速器。Fused-MBConv结构也非常简单即将原来的MBConv结构之前在将EfficientNetv1时有详细讲过主分支中的expansion conv1x1和depthwise conv3x3替换成一个普通的conv3x3如图2所示。作者也在EfficientNet-B4上做了一些测试发现将浅层MBConv结构替换成Fused-MBConv结构能够明显提升训练速度如表3所示将stage2,3,4都替换成Fused-MBConv结构后在Tesla V100上从每秒训练155张图片提升到216张。但如果将所有stage都替换成Fused-MBConv结构会明显增加参数数量以及FLOPs训练速度也会降低。所以作者使用NAS技术去搜索MBConv和Fused-MBConv的最佳组合。1.1.3 同等的放大每个stage是次优的。在EfficientNetV1中每个stage的深度和宽度都是同等放大的。但每个stage对网络的训练速度以及参数数量的贡献并不相同所以直接使用同等缩放的策略并不合理。在这篇文章中作者采用了非均匀的缩放策略来缩放模型。1.2 EfficientNetV2中做出的改进点在之前的一些研究中大家主要关注的是准确率以及参数数量(注意参数数量少并不代表推理速度更快)。但在近些年的研究中大家开始关注网络的训练速度以及推理速度(可能是准确率刷不动了)。但他们提升训练速度通常是以增加参数数量作为代价的。而这篇文章是同时关注训练速度以及参数数量的。引入新的网络(EfficientNetV2)该网络在训练速度以及参数数量上都优于先前的一些网络。提出了改进的渐进学习方法该方法会根据训练图像的尺寸动态调节正则方法(例如dropout、data augmentation和mixup)。通过实验展示了该方法不仅能够提升训练速度同时还能提升准确率。通过实验与先前的一些网络相比训练速度提升11倍参数数量减少为1/6.8​1.3 实验为了进一步验证渐进式学习策略的有效性作者还在Resnet以及EfficientNetV1上进行了测试如下表所示使用了渐进式学习策略后确实能够有效提升训练速度并且能够小幅提升Accuracy二、YOLO26EfficientNetV2将EfficientNetV2与YOLOv26融合并非一个随意的组合而是一次目标明确的架构创新。它的“前因后果”可以归结为为了解决特定场景如资源受限的设备下的部署难题研究者巧妙地借鉴了EfficientNetV2在模型效率上的优势对YOLOv26进行了“手术刀”式的轻量化改造。“因背景与动机”“问题现有模型如YOLOv26在资源受限设备上部署困难”“核心需求追求模型轻量化减少参数与计算量同时保持精度”“灵感来源EfficientNetV2本身以高效著称具备优秀的主干网络设计”“融合过程将EfficientNetV2作为起点进行改造并替换YOLOv26的原始主干”“果最终成果YOLOv26-E模型”“性能提升”总而言之这次融合的核心在于为了在资源有限的设备上实现高效的目标检测借用并强化了EfficientNetV2的轻量化能力来对YOLO26进行深度改造最终在几乎不损失精度的情况下实现了模型规模和计算成本的急剧下降。B站戳这里2.1 修改YAML文件改进源码地址2.2新建model.py改进源码地址2.3 修改tasks.py改进源码地址三、验证是否成功即可执行命令python train.py改完收工关注B站AI学术叫叫兽从此走上科研快速路遥遥领先同行改进源码地址写在最后学术因方向、个人实验和写作能力以及具体创新内容的不同而无法做到一通百通所以本文作者即B站Up主Ai学术叫叫兽在所有B站资料中留下联系方式以便在科研之余为家人们答疑解惑本up主获得过国奖发表多篇SCI擅长目标检测领域拥有多项竞赛经历拥有软件著作权核心期刊等经历。因为经历过所以更懂小白的痛苦因为经历过所以更具有指向性的指导祝所有科研工作者都能够在自己的领域上更上一层楼所有科研参考资料均可点击此链接合适的才是最好的希望我的能力配上你的努力刚好合适以下为给大家庭小伙伴们免费更新过的绘图代码均配有详细教程超小白也可一键操作! 后续更多提升文章档次的资料的更新请大家庭的小伙伴关注我B站及抖音Ai学术叫叫兽所有科研参考资料均可点击此链接合适的才是最好的希望我的能力配上你的努力刚好合适所有科研参考资料均可点击此链接合适的才是最好的希望我的能力配上你的努力刚好合适

相关新闻

瑞芯微开发板开机自启动设置

瑞芯微开发板开机自启动设置

文章目录 核心文件 文件内容解释 开机自启动AI例程设置 核心文件 用于存放开机自启动的文件路径: Ubuntu端:/etc/rcX.d,文件命名大多以K或者S开头。 其中K代表关闭时要执行的程序;S代表启动时要执行的程序; 文件名命名规则:K/S + 阿拉伯数字 + 字符串。 文件执行顺序按…

2026/5/17 6:51:16 阅读更多 →
深入React19任务调度器Scheduler

深入React19任务调度器Scheduler

Scheduler 最小堆 MessageChannel 时间片检查它的目标只有一个:推进任务,但永远别饿死浏览器。 调度任务 React 19 最新 Scheduler 源码**(packages/scheduler)** 中,普通任务(非 Immediate,…

2026/7/6 2:09:39 阅读更多 →
【DFS】BISHI77数水坑

【DFS】BISHI77数水坑

思路求解代码/*** 主方法,程序的入口点** param args 命令行参数* throws IOException 可能抛出IO异常*/public static void main(String[] args) throws IOException {// 使用BufferedReader读取标准输入,用于高效读取输入数据BufferedReader br new B…

2026/5/17 5:48:34 阅读更多 →

最新新闻

混合注意力(Channel+Spatial)替代SE模块:mAP涨2.3%但计算量只增5%的魔法

混合注意力(Channel+Spatial)替代SE模块:mAP涨2.3%但计算量只增5%的魔法

一、深夜调参现场:SE模块为什么突然“失灵”了? 凌晨两点,我盯着终端里跳动的mAP曲线,第37次实验的验证集损失突然在epoch 80处反弹。隔壁工位的同事早已趴在桌上睡着,键盘上还压着半杯冷掉的咖啡。这是我在YOLOv11上尝试混合注意力机制的第三周——SE、CBAM、ECA、CA、S…

2026/7/6 5:52:43 阅读更多 →
桌面AI客户端Chatbox:构建多模型智能工作站的实战指南

桌面AI客户端Chatbox:构建多模型智能工作站的实战指南

桌面AI客户端Chatbox:构建多模型智能工作站的实战指南 【免费下载链接】chatbox Powerful AI Client 项目地址: https://gitcode.com/GitHub_Trending/ch/chatbox Chatbox是一款功能强大的桌面AI客户端,支持OpenAI、Claude、Chatbox AI、Ollama和…

2026/7/6 5:52:43 阅读更多 →
Navicat无限试用终极指南:告别14天限制的3种简单方法

Navicat无限试用终极指南:告别14天限制的3种简单方法

Navicat无限试用终极指南:告别14天限制的3种简单方法 【免费下载链接】navicat_reset_mac navicat mac版无限重置试用期脚本 Navicat Mac Version Unlimited Trial Reset Script 项目地址: https://gitcode.com/gh_mirrors/na/navicat_reset_mac 你是否也曾为…

2026/7/6 5:52:43 阅读更多 →
复杂监控场景多维步态分析平台——目标追踪布控+人员隐性心理态势识别白皮书

复杂监控场景多维步态分析平台——目标追踪布控+人员隐性心理态势识别白皮书

复杂监控场景多维步态分析平台——目标追踪布控人员隐性心理态势识别白皮书 文档编号:GAIT-TRACK-MIND-PLAT-V7.0 出品单位:镜像视界浙江科技有限公司、镜像视界浙江普陀时空大数据应用技术联合研究院 课题背书:国家“十四五”时空大数据与…

2026/7/6 5:50:42 阅读更多 →
三步快速上手:Altium Designer 个人元件库完整指南

三步快速上手:Altium Designer 个人元件库完整指南

三步快速上手:Altium Designer 个人元件库完整指南 【免费下载链接】AltiumDesigner-Libraries Personal schematic symbol and footprint libraries for Altium Designer. 项目地址: https://gitcode.com/gh_mirrors/al/AltiumDesigner-Libraries 你是否正在…

2026/7/6 5:50:42 阅读更多 →
为什么Spek频谱分析器能帮你节省90%的音频分析时间?[特殊字符]

为什么Spek频谱分析器能帮你节省90%的音频分析时间?[特殊字符]

为什么Spek频谱分析器能帮你节省90%的音频分析时间?🎵 【免费下载链接】spek Acoustic spectrum analyser 项目地址: https://gitcode.com/gh_mirrors/sp/spek 想要快速理解音频文件的频率特性吗?Spek这款开源音频频谱分析工具可能是你…

2026/7/6 5:48:42 阅读更多 →

日新闻

H2 与 MySQL 单元测试兼容性:5 个关键 SQL 语句差异与规避方案

H2 与 MySQL 单元测试兼容性:5 个关键 SQL 语句差异与规避方案

H2与MySQL单元测试兼容性:5个关键SQL语句差异与规避方案1. 单元测试中的数据库兼容性挑战在Java开发领域,单元测试是保证代码质量的重要环节。当应用涉及数据库操作时,测试环境的搭建往往成为开发者的痛点。H2数据库因其轻量级、内存模式和快…

2026/7/6 0:01:17 阅读更多 →
Windows任务栏终极清理指南:用RBTray一键隐藏窗口到系统托盘

Windows任务栏终极清理指南:用RBTray一键隐藏窗口到系统托盘

Windows任务栏终极清理指南:用RBTray一键隐藏窗口到系统托盘 【免费下载链接】rbtray A fork of RBTray from http://sourceforge.net/p/rbtray/code/. 项目地址: https://gitcode.com/gh_mirrors/rb/rbtray 你是否厌倦了Windows任务栏上密密麻麻的图标&…

2026/7/6 0:01:17 阅读更多 →
Visual C++ 运行时库一键安装终极指南:告别DLL缺失烦恼

Visual C++ 运行时库一键安装终极指南:告别DLL缺失烦恼

Visual C 运行时库一键安装终极指南:告别DLL缺失烦恼 【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 你是否曾经遇到过这样的情况:下载了…

2026/7/6 0:05:19 阅读更多 →

周新闻

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容

B站视频下载神器BiliTools:5分钟学会轻松保存任何B站内容 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools …

2026/7/5 0:03:34 阅读更多 →
威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型全解析:从新手入门到实战应用,助你构建安全产品!

威胁模型的陌生现状在忙碌疲惫的一天里,参与了关于混合后量子密码学的讨论,应付端点攻击找茬的人,还参与留言板讨论后,发现“威胁模型”对多数人仍是陌生概念,且多被当作时髦用语。有趣的相关画作有一幅由 Embyr 创作的…

2026/7/5 0:03:34 阅读更多 →
渗透测试入门指南:从零基础到实战环境搭建

渗透测试入门指南:从零基础到实战环境搭建

1. 从“看热闹”到“入门”:我理解的渗透测试到底是什么?每次看到新闻里说某个大公司的数据被“黑”了,或者某个网站被攻击导致服务瘫痪,你是不是和我一样,心里会冒出两个念头:一是“这黑客真厉害”&#x…

2026/7/5 0:07:38 阅读更多 →

月新闻