一种基于注意力机制的小样本目标检测系统及方法技术方案

技术编号：38100148 阅读：9 留言：0更新日期：2023-07-06 09:17

本发明专利技术公开一种基于注意力机制的小样本目标检测系统及方法，系统包括：分组空间与通道注意力模块、注意力残差模块。分组空间与通道注意力模块用于完成基于空间信息嵌入的通道间的注意力机制，并将最终的空间与通道注意力的权重加载在原特征图上；注意力残差模块基于分组空间与通道注意力模块，通过卷积层、归一化层、激活函数等，以及残差连接，构成注意力残差模块，以避免注意力梯度消失与梯度爆炸。以避免注意力梯度消失与梯度爆炸。以避免注意力梯度消失与梯度爆炸。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于注意力机制的小样本目标检测系统及方法

[0001]本专利技术涉及一种基于注意力机制的小样本目标检测系统及方法，适用于计算机视觉中的小样本目标检测

技术介绍

[0002]随着人类社会的发展，人类获取信息的重要来源逐渐变为图像和视频，其中基于大量图像视频样本进行深度学习的系统越来越成熟，但在工业界，还存在着大量的专业的非热门类别的目标有采用目标检测的需求，将目标识别技术应用于这些小众方向是一个难题，其中面临最重要的难题一方面是数据集的缺乏，具体来说就是难以借助公开的数据集从而获得海量的训练数据；另一方面就是即使有大量的数据，对于这些数据的标注工作不仅费时更需要一定的专业技术背景。基于以上两个困难，基于深度学习的目标检测技术在工业界仍有巨大人的应用潜力，如果从较少的数据中就能训练学习出一个性能相对不错的算法模型，则将大大利于目标检测在小众领域的应用，因此如何设计算法在少量样本条件下对数据进行充分利用进行目标检测，是工业界对计算机视觉技术发展的迫切需求。小样本条件下的目标检测具有非常高的研究价值，在医疗、农业、海洋、军事等领域有着广泛的应用。
[0003]但由于对于目标类别数据集较小，普通的小样本目标检测模型的检测精度与一般的海量样本数据的目标检测模型精度差的很远，其中一个原因就是模型定位目标的问题，由于缺乏先验知识，很多模型目标检测结果框偏离实际的实例位置过远或者检测模型对于一些关键特征提取与关注度不够，这是造成小样本目标检测精度低的一个重要，
[0004]2017年，谷歌推出了Trans...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制的小样本目标检测系统，其特征在于，该系统包括：空间相关性与通道注意力模块和注意力残差模块；所述分组空间与通道注意力模块用于完成基于空间信息嵌入的通道间的注意力机制，并将最终的空间与通道注意力的权重加载在原特征图上；所述注意力残差模块是基于分组空间与通道注意力模块所构建的残差结构。2.根据权利要求1所述的一种基于注意力机制的小样本目标检测系统，其特征在于，所述分组空间与通道注意力模块分为三大模块，第一个模块为分组池化模块，将原始特征图分组，并对分组后的特征图沿宽度W和高度H两个方向得到平均池化图；第二个模块为空间注意力模块，对每一组的特征图借助两个方向上的池化图分别生成空间按相关性图，并将两个方向上的相关性图加载到源特征图上实现在空间上的注意力。第三个模块为通道注意力模块，通过将组内W和H两个方向得到平均池化图上进行拼接，而后统一进行一系列的卷积正则等操作将拼接后的特征图编码，而后再分别解码实现通道还原，并将最终的空间与通道注意力权重加载到原组特征图上，实现通道间上的注意力。3.根据权利要求1所述的一种基于注意力机制的小样本目标检测系统，其特征在于，所述注意力残差模块包含卷积层、激活函数层、批量标准化层、分组空间与通道注意力残差层和残差连接；分组空间与通道注意力残差层的嵌入能够对卷积运算后的特征图进行空间以及通道维度的加权。4.基于权利要求1
‑
3所述系统的小样本目标检测方法，其特征在于，包括如下步骤：步骤S1：通过将特征图在通道维度上进行分组，并对每一组的特征图在空间的两个方向上生成平均池化图；将两个方向上的池化图分别生成空间按相关性图，将每一组的两个方向上的相关性图加载到源特征图上实现在空间上的注意力；将每一组的两个方向上的相关性图进行拼接，接着统一进行一系列的卷积正则等操作将拼接后的特征图编码，而后再分别解码实现通道还原，将最终的空间与通道注意力权重加载到原组特征图上，实现通道间上的注意力；将每一组经过空间与通道注意力加权后的特征图沿通道进行拼接融合得到原始特征图经过注意力机制的输出；步骤S2：基于每个分组空间与通道注意力模块、卷积模块、批归一化模块、激活函数模块，构建注意力残差模块。5.根据权利要求4所述的小样本目标检测方法，其特征在于所述步骤S1具体包括：步骤S101：将输入的H
×
W
×
C的特征图，其中H代表图像高度，W代表图像宽度，C代表图像通道，在通道维度上分成多组，每组代表特定的子特征，通过分组可以对不同的特征针对性地进行学习和抑制噪声；步骤S102：将每一组特征X
k
分为两路，分别使用尺寸(W,1)和(1,H)的池化核沿着竖直方向和水平方向对每个通道做全局平均池化，得到高为H的行特征图以及宽为W的列特征图列特征图和上分别嵌入了特征组X
k
两个空间维度上的信息，与的表达式如式(1)(2...

【专利技术属性】
技术研发人员：杨绿溪，许诺，刘周勇，王潇祎，谢国烜，俞科栋，徐琴珍，俞非，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人