RT-DETR最新创新改进系列:ODConv-全维度动态卷积通过并行策略采用多维注意力机制沿核空间的四个维度学习互补性注意力,有效涨点神器!!!
RT-DETR最新创新改进系列ODConv-全维度动态卷积通过并行策略采用多维注意力机制沿核空间的四个维度学习互补性注意力,有效涨点神器购买相关资料后畅享一对一答疑畅享超多免费持续更新且可大幅度提升文章档次的纯干货工具ODConv提出的论文戳这一、ODConv概述1.1 ODConv文章摘要在每个卷积层中学习单个静态卷积核 1 是现代卷积神经网络CNN的常见训练范例。相反最近动态卷积的研究表明学习 n 个卷积核的线性组合及其输入相关注意力的加权可以显着提高轻量级 CNN 的准确性同时保持高效的推理。然而我们观察到现有的工作通过核空间的一个维度关于卷积核数量赋予卷积核动态属性但其他三个维度关于空间大小、输入通道数和输出通道数每个卷积核都被忽略了。受此启发我们提出了全维动态卷积ODConv一种更通用但更优雅的动态卷积设计以推进这方面的研究。 ODConv 利用一种新颖的多维注意力机制和并行策略来学习任何卷积层沿内核空间的所有四个维度的卷积核的互补注意力。作为常规卷积的直接替代品ODConv 可以插入到许多 CNN 架构中。在 ImageNet 和 MS-COCO 数据集上进行的大量实验表明ODConv 为各种流行的 CNN 主干网包括轻量级和大型主干网带来了可靠的准确度提升例如 3.77%∼5.71%|1.86%∼3.72% 的绝对 top-1 改进MobivleNetV2|ImageNet 数据集上的 ResNet 系列。有趣的是由于其改进的特征学习能力即使只有一个内核的 ODConv 也可以与现有的具有多个内核的动态卷积对应物竞争或超越从而大大减少了额外的参数。此外ODConv 在调节输出特征或卷积权重方面也优于其他注意力模块。1.2 主要原理ODConv可以视作CondConv的延续将CondConv中一个维度上的动态特性进行了扩展同时了考虑了空域、输入通道、输出通道等维度上的动态性故称之为全维度动态卷积。ODConv通过并行策略采用多维注意力机制沿核空间的四个维度学习互补性注意力。作为一种“即插即用”的操作它可以轻易的嵌入到现有CNN网络中。ImageNet分类与COCO检测任务上的实验验证了所提ODConv的优异性即可提升大模型的性能又可提升轻量型模型的性能实乃万金油是也值得一提的是受益于其改进的特征提取能力ODConv搭配一个卷积核时仍可取得与现有多核动态卷积相当甚至更优的性能。二、 改进教程2.1 修改YAML文件2.2 新建SwinTransformer.py2.3 修改tasks.py三、验证是否成功即可执行命令python train.py改完收工关注AI学术叫叫兽从此走上科研快速路遥遥领先同行写在最后学术因方向、个人实验和写作能力以及具体创新内容的不同而无法做到一通百通关注UPAi学术叫叫兽在所有B站资料中留下联系方式以便在科研之余为家人们答疑解惑本up主获得过国奖发表多篇SCI擅长目标检测领域拥有多项竞赛经历拥有软件著作权核心期刊等经历。因为经历过所以更懂小白的痛苦因为经历过所以更具有指向性的指导祝所有科研工作者都能够在自己的领域上更上一层楼以下为给大家庭小伙伴们免费更新过的绘图代码均配有详细教程超小白也可一键操作! 后续更多提升文章档次的资料的更新请大家庭的小伙伴关注UPAi学术叫叫兽