YOLO26最新创新改进系列：主干网络全新设计——EfficientNetV2-BackBone ，引入渐进式学习策略、自适应正则强度调整机制，共同优化训练速度和参数效率，全方位提升模型检测性能！！-尧图手机网站定制

YOLO26最新创新改进系列主干网络全新设计——EfficientNetV2-BackBone 引入渐进式学习策略、自适应正则强度调整机制共同优化训练速度和参数效率全方位提升模型检测性能购买相关资料后畅享一对一答疑畅享超多免费持续更新且可大幅度提升文章档次的纯干货工具见文末EfficientNetV2论文地址戳这详细的改进教程以及源码戳这戳这戳这B站AI学术叫叫兽源码在相簿的链接中动态中也有链接感谢支持祝科研遥遥领先一、EfficientNetV2概述文章摘要本文介绍了一种新的卷积网络EfficientNetV2它具有比之前的模型更快的训练速度和更好的参数效率。为了开发这些模型我们使用了一种训练感知的神经架构搜索和缩放的组合以共同优化训练速度和参数效率。这些模型是从具有新操作如Fused-MBConv的搜索空间中搜索出来的。我们的实验表明EfficientNetV2模型的训练速度比最先进的模型快得多同时体积最大可减小6.8倍。我们可以通过逐步增加训练中的图像尺寸来进一步加速训练但这往往会导致准确度降低。为了补偿这种准确度降低我们提出了一种改进的逐步学习方法它根据图像尺寸自适应地调整正则化例如数据增强。通过逐步学习我们的EfficientNetV2在ImageNet和CIFAR/Cars/Flowers数据集上明显优于以前的模型。通过在相同的ImageNet21k上进行预训练我们的EfficientNetV2在ImageNet ILSVRC2012上实现了87.3%的top-1准确率比最近的ViT高出2.0%的准确率同时使用相同的计算资源训练速度提高了5倍至11倍。通过上图很明显能够看出EfficientNetV2网络不仅Accuracy达到了当前的SOTAState-Of-The-Art水平而且训练速度更快参数数量更少比当前火热的Vision Transformer还要强。EfficientNetV2-XL (21k)在ImageNet ILSVRC2012的Top-1上达到87.3%。在EfficientNetV1中作者关注的是准确率参数数量以及FLOPs理论计算量小不代表推理速度快在EfficientNetV2中作者进一步关注模型的训练速度。1.1 EfficientNetV1中存在的问题1.1.1训练图像的尺寸很大时训练速度非常慢。这确实是个槽点在之前使用EfficientNet时发现当使用到B3img_size300- B7img_size600时基本训练不动而且非常吃显存。通过下表可以看到在Tesla V100上当训练的图像尺寸为380x380时batch_size24还能跑起来当训练的图像尺寸为512x512时batch_size24时就报OOM显存不够了。针对这个问题一个比较好想到的办法就是降低训练图像的尺寸之前也有一些文章这么干过。降低训练图像的尺寸不仅能够加快训练速度还能使用更大的batch_size.1.1.2 在网络浅层中使用Depthwise convolutions速度会很慢。虽然Depthwise convolutions结构相比普通卷积拥有更少的参数以及更小的FLOPs但通常无法充分利用现有的一些加速器虽然理论上计算量很小但实际使用起来并没有想象中那么快。在近些年的研究中有人提出了Fused-MBConv结构去更好的利用移动端或服务端的加速器。Fused-MBConv结构也非常简单即将原来的MBConv结构之前在将EfficientNetv1时有详细讲过主分支中的expansion conv1x1和depthwise conv3x3替换成一个普通的conv3x3如图2所示。作者也在EfficientNet-B4上做了一些测试发现将浅层MBConv结构替换成Fused-MBConv结构能够明显提升训练速度如表3所示将stage2,3,4都替换成Fused-MBConv结构后在Tesla V100上从每秒训练155张图片提升到216张。但如果将所有stage都替换成Fused-MBConv结构会明显增加参数数量以及FLOPs训练速度也会降低。所以作者使用NAS技术去搜索MBConv和Fused-MBConv的最佳组合。1.1.3 同等的放大每个stage是次优的。在EfficientNetV1中每个stage的深度和宽度都是同等放大的。但每个stage对网络的训练速度以及参数数量的贡献并不相同所以直接使用同等缩放的策略并不合理。在这篇文章中作者采用了非均匀的缩放策略来缩放模型。1.2 EfficientNetV2中做出的改进点在之前的一些研究中大家主要关注的是准确率以及参数数量(注意参数数量少并不代表推理速度更快)。但在近些年的研究中大家开始关注网络的训练速度以及推理速度(可能是准确率刷不动了)。但他们提升训练速度通常是以增加参数数量作为代价的。而这篇文章是同时关注训练速度以及参数数量的。引入新的网络(EfficientNetV2)该网络在训练速度以及参数数量上都优于先前的一些网络。提出了改进的渐进学习方法该方法会根据训练图像的尺寸动态调节正则方法(例如dropout、data augmentation和mixup)。通过实验展示了该方法不仅能够提升训练速度同时还能提升准确率。通过实验与先前的一些网络相比训练速度提升11倍参数数量减少为1/6.81.3 实验为了进一步验证渐进式学习策略的有效性作者还在Resnet以及EfficientNetV1上进行了测试如下表所示使用了渐进式学习策略后确实能够有效提升训练速度并且能够小幅提升Accuracy二、YOLO26EfficientNetV2将EfficientNetV2与YOLOv26融合并非一个随意的组合而是一次目标明确的架构创新。它的“前因后果”可以归结为为了解决特定场景如资源受限的设备下的部署难题研究者巧妙地借鉴了EfficientNetV2在模型效率上的优势对YOLOv26进行了“手术刀”式的轻量化改造。“因背景与动机”“问题现有模型如YOLOv26在资源受限设备上部署困难”“核心需求追求模型轻量化减少参数与计算量同时保持精度”“灵感来源EfficientNetV2本身以高效著称具备优秀的主干网络设计”“融合过程将EfficientNetV2作为起点进行改造并替换YOLOv26的原始主干”“果最终成果YOLOv26-E模型”“性能提升”总而言之这次融合的核心在于为了在资源有限的设备上实现高效的目标检测借用并强化了EfficientNetV2的轻量化能力来对YOLO26进行深度改造最终在几乎不损失精度的情况下实现了模型规模和计算成本的急剧下降。B站戳这里2.1 修改YAML文件改进源码地址2.2新建model.py改进源码地址2.3 修改tasks.py改进源码地址三、验证是否成功即可执行命令python train.py改完收工关注B站AI学术叫叫兽从此走上科研快速路遥遥领先同行改进源码地址写在最后学术因方向、个人实验和写作能力以及具体创新内容的不同而无法做到一通百通所以本文作者即B站Up主Ai学术叫叫兽在所有B站资料中留下联系方式以便在科研之余为家人们答疑解惑本up主获得过国奖发表多篇SCI擅长目标检测领域拥有多项竞赛经历拥有软件著作权核心期刊等经历。因为经历过所以更懂小白的痛苦因为经历过所以更具有指向性的指导祝所有科研工作者都能够在自己的领域上更上一层楼所有科研参考资料均可点击此链接合适的才是最好的希望我的能力配上你的努力刚好合适以下为给大家庭小伙伴们免费更新过的绘图代码均配有详细教程超小白也可一键操作! 后续更多提升文章档次的资料的更新请大家庭的小伙伴关注我B站及抖音Ai学术叫叫兽所有科研参考资料均可点击此链接合适的才是最好的希望我的能力配上你的努力刚好合适所有科研参考资料均可点击此链接合适的才是最好的希望我的能力配上你的努力刚好合适

YOLO26最新创新改进系列：主干网络全新设计——EfficientNetV2-BackBone ，引入渐进式学习策略、自适应正则强度调整机制，共同优化训练速度和参数效率，全方位提升模型检测性能！！

相关新闻

瑞芯微开发板开机自启动设置

深入React19任务调度器Scheduler

【DFS】BISHI77数水坑

最新新闻

混合注意力（Channel+Spatial）替代SE模块：mAP涨2.3%但计算量只增5%的魔法

桌面AI客户端Chatbox：构建多模型智能工作站的实战指南

Navicat无限试用终极指南：告别14天限制的3种简单方法

复杂监控场景多维步态分析平台——目标追踪布控+人员隐性心理态势识别白皮书

三步快速上手：Altium Designer 个人元件库完整指南

为什么Spek频谱分析器能帮你节省90%的音频分析时间？[特殊字符]

日新闻

H2 与 MySQL 单元测试兼容性：5 个关键 SQL 语句差异与规避方案

Windows任务栏终极清理指南：用RBTray一键隐藏窗口到系统托盘

Visual C++ 运行时库一键安装终极指南：告别DLL缺失烦恼

周新闻

B站视频下载神器BiliTools：5分钟学会轻松保存任何B站内容

威胁模型全解析：从新手入门到实战应用，助你构建安全产品！

渗透测试入门指南：从零基础到实战环境搭建

月新闻