RT-DETR最新创新改进系列：ODConv-全维度动态卷积通过并行策略采用多维注意力机制沿核空间的四个维度学习互补性注意力,有效涨点神器！！！

张

张建站

2026/7/24 19:50:26

10分钟阅读

RT-DETR最新创新改进系列ODConv-全维度动态卷积通过并行策略采用多维注意力机制沿核空间的四个维度学习互补性注意力,有效涨点神器购买相关资料后畅享一对一答疑畅享超多免费持续更新且可大幅度提升文章档次的纯干货工具ODConv提出的论文戳这一、ODConv概述1.1 ODConv文章摘要在每个卷积层中学习单个静态卷积核 1 是现代卷积神经网络CNN的常见训练范例。相反最近动态卷积的研究表明学习 n 个卷积核的线性组合及其输入相关注意力的加权可以显着提高轻量级 CNN 的准确性同时保持高效的推理。然而我们观察到现有的工作通过核空间的一个维度关于卷积核数量赋予卷积核动态属性但其他三个维度关于空间大小、输入通道数和输出通道数每个卷积核都被忽略了。受此启发我们提出了全维动态卷积ODConv一种更通用但更优雅的动态卷积设计以推进这方面的研究。 ODConv 利用一种新颖的多维注意力机制和并行策略来学习任何卷积层沿内核空间的所有四个维度的卷积核的互补注意力。作为常规卷积的直接替代品ODConv 可以插入到许多 CNN 架构中。在 ImageNet 和 MS-COCO 数据集上进行的大量实验表明ODConv 为各种流行的 CNN 主干网包括轻量级和大型主干网带来了可靠的准确度提升例如 3.77%∼5.71%|1.86%∼3.72% 的绝对 top-1 改进MobivleNetV2|ImageNet 数据集上的 ResNet 系列。有趣的是由于其改进的特征学习能力即使只有一个内核的 ODConv 也可以与现有的具有多个内核的动态卷积对应物竞争或超越从而大大减少了额外的参数。此外ODConv 在调节输出特征或卷积权重方面也优于其他注意力模块。1.2 主要原理ODConv可以视作CondConv的延续将CondConv中一个维度上的动态特性进行了扩展同时了考虑了空域、输入通道、输出通道等维度上的动态性故称之为全维度动态卷积。ODConv通过并行策略采用多维注意力机制沿核空间的四个维度学习互补性注意力。作为一种“即插即用”的操作它可以轻易的嵌入到现有CNN网络中。ImageNet分类与COCO检测任务上的实验验证了所提ODConv的优异性即可提升大模型的性能又可提升轻量型模型的性能实乃万金油是也值得一提的是受益于其改进的特征提取能力ODConv搭配一个卷积核时仍可取得与现有多核动态卷积相当甚至更优的性能。二、改进教程2.1 修改YAML文件2.2 新建SwinTransformer.py2.3 修改tasks.py三、验证是否成功即可执行命令python train.py改完收工关注AI学术叫叫兽从此走上科研快速路遥遥领先同行写在最后学术因方向、个人实验和写作能力以及具体创新内容的不同而无法做到一通百通关注UPAi学术叫叫兽在所有B站资料中留下联系方式以便在科研之余为家人们答疑解惑本up主获得过国奖发表多篇SCI擅长目标检测领域拥有多项竞赛经历拥有软件著作权核心期刊等经历。因为经历过所以更懂小白的痛苦因为经历过所以更具有指向性的指导祝所有科研工作者都能够在自己的领域上更上一层楼以下为给大家庭小伙伴们免费更新过的绘图代码均配有详细教程超小白也可一键操作! 后续更多提升文章档次的资料的更新请大家庭的小伙伴关注UPAi学术叫叫兽

2026年源码行业TOP选择：友价源码如何赢得6000+客户信赖？

在数字浪潮席卷的今天，每一个创业者都渴望找到一款既稳定又灵活的源码系统，来支撑自己梦想的实现。然而，市场的纷繁复杂常常让人眼花缭乱，如何选择一款真正靠谱的源码，成为许多人心中的难题。直到有一天，我…...

2026/5/8 17:40:32 阅读更多 →

2026年AI API中转网站排行榜：这些网站让你在AI开发中省钱、省心又省力

在AI开发领域摸爬滚打多年，大家难免会遇到一些闹心事儿。比如刚给API中转网站充值几百块，第二天网站就打不开了；或者号称是GPT - 5.4满血版，实际性能却连3.5都不如。到了2026年，大模型更新换代的速度快得让人目不暇接&…...

2026/5/16 11:25:07 阅读更多 →

如何快速掌握Sketch Measure：设计师必备的终极设计标注工具指南

如何快速掌握Sketch Measure：设计师必备的终极设计标注工具指南【免费下载链接】sketch-measure Make it a fun to create spec for developers and teammates 项目地址: https://gitcode.com/gh_mirrors/sk/sketch-measure 还在为设计稿标注而烦恼吗&#…...

2026/5/11 4:46:56 阅读更多 →

【AI问数】多智能体协同架构：行业首创的AI问数大脑

鲲溟智能 AI智能问数系列第15篇 | 2026-07-12 10 大智能体 Multi-Agent 协同架构端到端自动化 99.97% 可用性鲲溟智能首创10大智能体协同架构，是AI问数的大脑。每个Agent专精一个领域，通过Orchestrator智能编排，实现复杂任务的端到…...

2026/7/22 19:10:55 阅读更多 →

Kimi LeetCode 3621. 位计数深度为 K 的整数数目 I Python3实现

LeetCode 3621. 位计数深度为 K 的整数数目 I Python3 实现python from functools import lru_cacheclass Solution:def popcountDepth(self, n: int, k: int) -> int:# k0：只有 1 的深度为 0if k 0:return 1 if n > 1 else 0# 预处理 1~60 的 popcount-dept…...

2026/7/22 8:01:32 阅读更多 →

向量检索加速：ANN 索引选型和查询参数调优实战

向量检索加速：ANN 索引选型和查询参数调优实战基础设施不需要漂亮话。一个 100 万向量的知识库从"勉强能用"到"丝滑检索"，差距不在算法，在工程参数的调优。一、两个向量检索系统，性能差 20 倍团队内两套知…...

2026/7/22 8:01:25 阅读更多 →

鸿蒙 ArkTS 实战：Menu Nutrition Advice 从智能助手到保存闭环完整解析

鸿蒙 ArkTS 实战：Menu Nutrition Advice 从智能助手到保存闭环完整解析前言 Menu Nutrition Advice 是一个面向菜单营养建议的鸿蒙 ArkTS 单页工具。它把主题输入、数量统计、辅助开关、备注和保存状态组织到一个移动端工作台中。项目服务于根据餐单生成营养…...

2026/7/22 8:01:58 阅读更多 →