基于注意力机制的红外单帧小目标检测方法技术

技术编号:35701248 阅读:20 留言:0更新日期:2022-11-23 14:55
本发明专利技术公开了一种基于注意力机制的红外单帧小目标检测方法,主要解决现有技术模型泛化能力较差且存在严重误检、检测率较低及虚警较高的问题。其实现方案是:从公开数据集中选择带标注的数据集,对其预处理为尺寸统一的训练集和测试集;构建由编码端解码端交互引导模块、虚警注意模块和主干网络组成的多维度注意力感知网络;将训练集及其标注信息按批量大小分别平分为多个配对图像组,并依次循环输入多次至多维度注意力感知网络完成训练;将测试集输入至训练完成的多维度注意力感知网络,输出红外小目标检测结果。本发明专利技术对目标大小和场景变化具有很高的鲁棒性,能够在提高检测率的同时有效降低虚警率,可用于复杂背景下红外小目标的精确检测。标的精确检测。标的精确检测。

【技术实现步骤摘要】
基于注意力机制的红外单帧小目标检测方法


[0001]本专利技术属于图像处理与计算机视觉
,特别涉及一种红外单帧小目标检测方法,可用于复杂背景下红外小目标的精确检测。

技术介绍

[0002]近年来,计算机视觉技术迅速发展,在各个领域得到了广泛应用。红外小目标检测作为计算机视觉技术的重要分支,由于红外传感器具有可全天候工作、抗干扰性能强、弹载方便等独特优势,使其在精确制导、武器制造、监控预警等方面有很高的应用价值。因此,红外小目标检测技术受到了世界各国专家学者的关注,成为了近年来的研究热点之一。
[0003]目前,红外小目标检测算法的关键问题是如何在具有复杂背景的红外图像中实现目标的准确定位和分割,提高检测率并降低虚警率。其主要检测算法分为传统的红外小目标检测算法和基于深度学习的红外小目标检测算法。
[0004]传统的红外小目标检测主要依赖于传统手工设计的特征进行检测,即将红外小目标建模为从背景中弹出的异常值,主要分为基于滤波器的方法、基于局部对比度的方法和基于低秩的方法,其中:
[0005]基于滤波器的方法,是直接从滤波后的图像中通过设定阈值进行目标分割,典型的方法如Deshpande等人在Max

mean and max

median filters for detection of small targets[C]//Signal and Data Processing of Small Targets 1999.International Society for Optics and Photonics,1999,3809:74

83中提出将Max

mean和Max

median滤波器应用于红外小目标的检测中;Zeng等人在The design of top

hat morphological filter and application to infrared target detection[J].Infrared physics&technology,2006,48(1):67

76中提出了Top

hat滤波器,该方法利用数学形态学进行小目标检测,通过开操作去除图像中的小目标获取背景图像,再将原图像与背景图像做差即可实现小目标检测。这类基于滤波器的方法容易受到背景中的杂波和噪声的影响,检测鲁棒性差。
[0006]基于局部对比度的方法,主要通过局部对比度处理以增强目标信号,提高检测精度。典型的方法如Chen等人在A local contrast method for small infrared target detection[J].IEEE transactions on geoscience and remote sensing,2013,52(1):574

581中通过获取红外图像的局部对比度图和计算当前位置与其周围区域的差异来达到增强目标或抑制背景的目的;Han等人在A robust infrared small target detection algorithm based on human visual system[J].IEEE Geoscience and Remote Sensing Letters,2014,11(12):2168

2172中基于HVS对比机制提出了改进的局部对比度度量,对红外小目标检测具有良好的鲁棒性。这类基于局部对比度的方法由于易受到边缘和噪声等因素的影响,导致误检率高。
[0007]基于低秩的方法,是假设目标图像块是一个稀疏矩阵,背景是一个低秩矩阵,将小目标检测问题转化为优化问题以恢复低秩矩阵和稀疏矩阵,从而实现小目标检测。具有代
表性的有Gao等人在Infrared patch

image model for small target detection in a single image[J].IEEE transactions on image processing,2013,22(12):4996

5009中提出的IPI算法;Zhang等人在Infrared small target detection via non

convex rank approximation minimization joint l2,1norm[J].Remote Sensing,2018,10(11):1821中提出的NRAM算法。该类方法存在的不足是:对像素值敏感、耗时较长。
[0008]随着深度学习技术的兴起,基于深度学习的红外小目标检测方法已逐渐成为当前领域的研究热点,其具有强大的模型拟合能力,通过将大量数据输入卷积神经网络中进行训练以主动学习特征来达到检测小目标的目的,实现更好的检测性能。Liu等人在Image small target detection based on deep learning with SNR controlled sample generation[J].Current Trends in Computer Science and Mechanical Automation,2017,1:211

220中第一次使用卷积神经网络进行红外小目标检测,该方法首先从一些云天图像中随机抽取背景部分,然后将随机生成的目标点添加到具有受控信噪比的背景中,再进行训练和测试实现小目标的检测;Dai等人在Asymmetric contextual modulation for infrared small target detection[C]//Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision.2021:950

959中提出了一个用于单帧红外图像小目标检测的公共数据集SIRST,并设计了非对称上下文ACM模块,该模块在SIRST数据集上有良好的检测性能;同年,Dai等人又在Attentional local contrast networks for infrared small target detection[J].IEEE Transactions on Geoscience and Remote Sensing,2021,59(11):9813

9824提出了注意力局部对比网络ALCNet,该方法将卷积神经网络与常规的模型驱动方法相结合以突出和保留小目标的特征,进一步提升了检测性能。Tong等人在EAAU

Net:Enhanced asymmetric attention U

Net for infrared small target d本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制的红外单帧小目标检测方法,其特征在于,包括如下步骤:(1)从公开的红外小目标数据集中选择一组带标注的数据集,并依次进行在0.7~1.7范围内的随机放缩、随机裁剪或零填充操作,得到尺寸统一为480
×
480的训练集和测试集数据集;(2)在Pytorch框架下构建多维度注意力感知网络MDA

Net:(2a)建立由一个浅层通道注意力子模块、一个深层通道注意力子模块和一个逐点注意力子模块组成的编码端解码端交互引导模块EDIG;(2b)建立由非局部注意力模块与非局部特征融合模块连接组成的虚警注意模块AFF;(2c)选用现有的三个卷积操作单元、一个最大池化操作单元、两个上采样模块、十八个残差块构成一个八层编解码结构的主干网络;(2d)将两个(2a)中构建的EDIG模块、一个(2b)中构建的AFF模块嵌入到八层编解码结构的主干网络中,组成Pytorch框架下的多维度注意力感知网络,并将IoU Loss函数作为该网络的损失函数;(3)采用训练集及其标注信息通过梯度下降法对多维度注意力感知网络进行训练,得到训练好的多维度注意力感知网络;(4)将测试集输入到训练好的多维度注意力感知网络中,输出红外小目标检测结果。2.根据权利要求1所述的方法,其特征在于:步骤(2a)中建的立编码端解码端交互引导模块EDIG,其结构关系如下:将浅层通道注意力子模块和深层通道注意力子模块分别与逐点注意力子模块的浅层输入端口和深层输入端口对应连接,且该深层通道注意力子模块和浅层通道注意力子模块的输出结果再逐像素相乘后与逐点注意力子模块输出的结果进行相加,相加后的结果即为编码端解码端交互引导EDIG模块的输出结果;所述浅层通道注意力子模块和深层通道注意力子模块结构相同,两者均包括全局平均池化层、两个全连接层、ReLU激活函数层和sigmoid函数层;每个子模块的结构为:输入端口

全局平均池化层

第一全连接层

ReLU激活函数层

第二全连接层

sigmoid函数层,该sigmoid函数层的输出与该子模块原始输入特征相乘后,得到该子模块的输出结果;所述逐点注意力子模块包括两个逐点卷积层、ReLU激活函数层和sigmoid函数层;该模块有浅层和深层两个输入端口、一个输出端口,其结构为:来自浅层的输入端口

第一逐点卷积层

ReLU激活函数层

第二逐点卷积层

sigmoid函数层,该sigmoid函数层的输出与该子模块来自深层的输入特征相乘,得到该子模块的输出结果。3.根据权利要求1所述的方法,其特征在于:步骤(2b)的非局部注意力模块,由三条支路并行组成,每条支路的结构为:输入端口

卷积层

Reshape层,卷积核大小均为1*1,卷积步长均为1,其中:第1条支路的输出R1(f(X))与第2条支路的输出R2(f(X))相乘,得到第一矩阵:E(X)=R1(f(X))
·
R2(f(X)),式中,f(
·
)表示卷积操作,R(
·
)表示Reshape操作;第3条支路的输出R3(f(X))与第一矩阵E(X)相乘得到第二矩阵:D(X)=R3(f(X))
·
E(X);将第二矩阵D(X)经过一次卷积核大小为1*1、卷积步长为1的卷积层得到输出特征f(D(X)),该输出特征f(D(X))与非局部注意力模块的输入X逐像素相加,得到该模块的输出结
果:Y(X)=f(D(X))+X。4.根据权利要求1所述的方法,其特征在于:步骤(2b)的非局部特征融合模块,由三条支路并行组成,其中:第1条支路的结构为:深层输入端口

卷积层

Reshape层,该卷积层的卷积核大小为1*1,卷积步长均为1;第2条和第3条支路结构相同,其依次为:浅层输入端口

最大池化层

卷积层

Reshape层,该卷积层的卷积核大小为1*1,卷积步长均为1,最大池化层卷积核大小为1*1;第1条支路的输出R1(f(X
h
))与第2条支路的输出R2(f(MaxPool(X
l
)))相乘,得到矩阵:E(X
hl
)=R1(f(X
h
))
·
R2(f(MaxPool(X
l
))),式中,MaxPool(
·
)表示最大池化操作;第3条支路的输出R3(f(MaxPool(X
l
)))与...

【专利技术属性】
技术研发人员:王柯俨吴雪岩周培诚杨丽鋆张铭津刘凯李云松
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1