前言
本文介绍了卷积块注意力模块(CBAM)及其在YOLOv11中的集成。CBAM是一种用于CNN的注意力机制,通过依次在通道和空间维度推断注意力图,自适应优化输入特征图。该模块轻量通用,可无缝集成到任何CNN架构中。我们将CBAM引入YOLOv11,在检测头部分的不同尺度特征图上应用该模块。实验表明,改进后的YOLOv11在目标检测任务中表现良好,证明了CBAM在提升模型性能方面的有效性和广泛适用性。
文章目录: YOLOv11改进大全:卷积层、轻量化、注意力机制、损失函数、Backbone、SPPF、Neck、检测头全方位优化汇总
专栏链接: YOLOv11改进专栏
介绍

摘要
我们提出了一种名为卷积块注意力模块(Convolutional Block Attention Module,CBAM)的新型注意力机制,该模块设计简洁但效果显著,专门用于前馈卷积神经网络。在给定中间特征图的情况下,该模块依次沿着通道和空间两个独立维度推断注意力图,随后将所得注意力图与输入特征图进行乘法操作以实现自适应特征优化。CBAM作为一种轻量级且通用性强的模块,能够无缝集成到任意卷积神经网络(CNN)架构中,其计算开销可忽略不计,并支持与基础CNN进行端到端的联合训练。通过在ImageNet-1K、MS COCO检测以及VOC 2007检测数据集上进行广泛实验,我们验证了CBAM的有效性。实验结果表明,该模块在多种模型架构中均能带来分类和检测性能的一致提升,充分证明了其广泛的适用性。相关代码与模型将予以公开发布。
文章链接
论文地址:论文地址
代码地址:代码地址
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



