YOLOv11 改进 - 即插即用 | SMFA自调制特征聚合：双分支协同破解特征冗余，增强多尺度目标感知

原创已于 2025-12-09 20:34:50 修改 · 418 阅读

10 GEO检测

标签

#YOLO #人工智能 #目标检测 #计算机视觉 #深度学习

于 2025-11-26 21:36:58 首次发布

最新YOLOv11改进专栏专栏收录该内容

193 篇文章 ¥99.90 ¥299.90

订阅专栏

前言

本文介绍了轻量级自调制特征聚合网络SMFANet及其核心模块SMFA在YOLOv11中的结合应用。为解决基于Transformer的图像恢复方法计算开销大、捕获局部细节能力弱的问题，提出SMFA模块，通过EASA分支建模非局部信息，LDE分支捕获局部细节，还提出PCFN精炼特征。我们将SMFA集成进YOLOv11，实验表明，SMFANet系列在重建性能与计算效率上取得更佳平衡，改进后的YOLOv11也取得了良好实验结果。

文章目录： YOLOv11改进大全：卷积层、轻量化、注意力机制、损失函数、Backbone、SPPF、Neck、检测头全方位优化汇总

专栏链接: YOLOv11改进专栏

介绍

摘要

基于Transformer架构的图像恢复方法凭借其自注意力（Self-Attention, SA）机制在挖掘非局部信息方面的独特优势，在高分辨率图像重建任务中展现出显著的性能提升。然而，传统Transformer中的点积自注意力计算机制存在巨大的计算开销，严重制约了其在低功耗设备中的实际部署应用。此外，自注意力机制固有的低通滤波特性限制了其对局部细节信息的捕获能力，导致重建结果往往呈现过度平滑的趋势。针对上述技术挑战，本研究提出了一种创新的自调制特征聚合模块（Self-Modulation Feature Aggregation, SMFA），通过协同整合局部与非局部特征交互机制来实现更精确的图像重建效果。具体而言，SMFA模块引入了一种高效的自注意力近似计算分支（Efficient Approximation of Self-Attention, EASA）用于建模非局部依赖关系，同时采用局部细节估计分支（Local Detail Estimation, LDE）专门负责捕获精细的局部结构信息。此外，我们进一步设计了基于部分卷积（Partial Convolution）的前馈网络架构（PCFN），用于精细化处理由SMFA模块提取的特征表示。大量实验验证结果表明，所提出的SMFANet系列模型在多个公共基准数据集上实

了解本专栏