YOLOv11改进 - C3k2融合 | C3k2融合ODConv全维度动态卷积,通过四维注意力机制实现多维度自适应特征增强

前言

本文介绍了全方位动态卷积(ODConv)技术在YOLOv11中的结合,它是一种更通用优雅的动态卷积设计。ODConv利用新颖的多维注意力机制和并行策略,在卷积核空间的四个维度上学习互补注意力。作为常规卷积的替代品,可嵌入多种CNN架构。在ImageNet和MS - COCO数据集上实验表明,它能为各类CNN骨干网络带来准确性提升。我们将ODConv集成进YOLOv11,替换部分模块。实验脚本运行结果显示,改进后的模型在目标检测任务中具备一定优势,有望进一步提升检测性能。

文章目录: YOLOv11改进大全:卷积层、轻量化、注意力机制、损失函数、Backbone、SPPF、Neck、检测头全方位优化汇总

专栏链接: YOLOv11改进专栏

介绍

image-20240117150056360

摘要

在现代卷积神经网络(CNN)中,在每个卷积层学习单个静态卷积核是常见的训练范式。不过,近期动态卷积研究显示,通过学习 n 个卷积核的线性组合,且这些卷积核的权重取决于输入相关注意力,可显著提高轻量级 CNN 的准确性,同时维持高效推理。然而,我们发现现有工作仅在一个维度(卷积核数量)赋予卷积核动态属性,而另外三个维度(每个卷积核的空间大小、输入通道数和输出通道数)被忽视。受此启发,我们提出了全方位动态卷积(ODConv),这是一种更为通用且精巧的动态卷积设计,旨在推动该研究方向的发展。ODConv 运用一种新颖的多维注意力机制和并行策略,在任意卷积层的卷积核空间的所有四个维度上学习卷积核的互补注意力。作为常规卷积的替代方案,ODConv 可嵌入众多 CNN 架构中。在 ImageNet 和 MS - COCO 数据集上的大量实验表明,ODConv 能为各类主流 CNN 骨干网络带来稳定的准确性提升,涵盖轻量级和大型网络,例如在 ImageNet 数据集上,为 MobileNetV2 和 ResNet 系列分别带来 3.77%∼5.71% 和 1.86%∼3.72% 的绝对 top - 1 改进。值得注意的是,由于其增强的特征学习能力,即便只有一个卷积核的 ODConv 也能与现有的多核动态卷积方法相抗衡甚至超越它们,大幅减少了额外参数。此外,ODConv 也优于其他用于调节输出特征或卷

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

魔改工程师

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值