一种军事敏感区域迭代反馈红外目标检测模型建立方法技术

技术编号:38345628 阅读:26 留言:0更新日期:2023-08-02 09:25
本发明专利技术公开了一种军事敏感区域迭代反馈红外目标检测模型建立方法,包括:通过红外相机获取军事敏感区域目标图像;对目标图像使用简化的骨干网络提取特征,得到每一轮初步的预测图;将经过骨干网络得到的初步预测图输入到结合语义信息的多重注意力模块中,通过注意力机制并结合全局信息的方式进行特征增强;计算每一轮网络输出的预测图和真值图之间的不确定性,计算不确定性损失。本发明专利技术通过使用简化的骨干网络结构解决了目标过小易在网络深层丢失的问题,利用改进的多重注意力机制进一步细化分割结果,同时使用迭代后馈的搜索过程减少了目标的漏检率,使得精度得到了提升,结合不确定性估计,减少模型的不确定性提升检测精度。度。度。

【技术实现步骤摘要】
一种军事敏感区域迭代反馈红外目标检测模型建立方法


[0001]本专利技术涉及红外目标检测
,具体为一种军事敏感区域迭代反馈红外目标检测模型建立方法。

技术介绍

[0002]军事敏感区域通常是指容易引起军事冲突的区域,或者涉及高度军事机密的区域。即一些关乎国防安全的区域,比如军事基地、军用机场、地下指挥工程、港口、导弹等。对于军事敏感区域的目标能进行早期预警识别、精准定位目标,对于保卫国防安全以及占据战场主动权具有重要作用。与可见光探测和雷达探测方式相比,红外检测系统具有作用距离远、隐蔽性高、抗干扰性好等特点,在军事领域有着广泛应用。因此,基于深度学习的红外目标检测模型对于提升军事敏感区域目标检测准确性和可靠性具有重要意义。
[0003]但由于红外本身成像特点,在检测中有如下难点。一是成像面积小,由于目标通常离探测器较远,一般在探测器上只占一个或几个像素点;目标和边界模糊不清,缺乏目标形状和幅度分布等信息以及缺乏尺寸、纹理等特征。二是信号强度弱,信噪比低,目标辐射能量在受到长距离大气衰减、大气湍流后,到达红外接收端能量较低,目标像点的信号强度较弱。三是目标辐射特性复杂及背景复杂,无论背景是天空、大地还是海面,背景辐射、强杂波、阳光等不确定影响因素都会叠加在目标的热辐射上,加之背景也在运动,造成目标热辐射变化规律不易掌握,增加了红外目标检测的困难。

技术实现思路

[0004]本专利技术的目的在于提供一种军事敏感区域迭代反馈红外目标检测模型建立方法、装置、设备及介质,以解决现有的红外目标检测精度不高,检测形状与真实值相差较大的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:一种军事敏感区域迭代反馈红外目标检测模型建立方法,包括以下步骤:
[0006]通过红外相机获取军事敏感区域目标图像;
[0007]对目标图像使用简化的骨干网络提取特征,得到每一轮初步的预测图;
[0008]将经过骨干网络得到的初步预测图输入到结合语义信息的多重注意力模块中,通过注意力机制并结合全局信息的方式进行特征增强;
[0009]计算每一轮网络输出的预测图和真值图之间的不确定性,计算不确定性损失;
[0010]将上一轮输出的预测图输入到下一轮网络中,且将上一轮每个结点包含的中间特征输入到下一轮网络的对应节点中,重复上述过程直至达到最大迭代次数结束搜索。
[0011]优选的,所述通过红外相机获取军事敏感区域目标图像,包括:
[0012]使用红外相机拍摄军事敏感区域目标图像,获得相应的源图像;
[0013]对获得的目标图像进行人工标注,标记目标位置和形状得到真值图,用于网络的训练和验证。
[0014]优选的,所述对目标图像使用简化的骨干网络提取特征,得到每一轮初步的预测图,包括:
[0015]构成骨干网络的基础块使用通道空间注意力机制取代卷积块,通道空间注意力模块计算如下式所示:
[0016]F

=M
s
(M
c
(F)
×
F)
×
(M
c
(F)
×
F)
[0017]M
c
(F)=σ(MLP(AvgPool(F))+MLP(MaxPool(F)))
[0018]M
s
(F)=σ(f7×7([AvgPool(F);MaxPool(F)]))
[0019]其中,F代表输入的特征图,AvgPool和MaxPool分别代表平均池化和最大池化操作,MLP代表多层感知机,σ代表激活操作f7×7,代表卷积操作,F

代表输出的特征图。
[0020]优选的,所述将经过骨干网络得到的初步预测图输入到结合语义信息的多重注意力模块中,通过利用全局信息和注意力机制起到特征增强的作用,包括:
[0021]将经过骨干网络得到的预测图输入到三重注意力机制中,计算C、W、H三个维度之间两两成对的依赖关系,将三个分支得到的特征图相加得到map1;
[0022][0023]其中λ1代表输入的原特征,和代表将输入特征沿W轴和H轴沿逆时针旋转90
°
得到的特征,σ代表激活操作,φ代表卷积层,Z表示Z

pool层,d=0代表在张量的第0维进行操作,即:
[0024]Z(λ)=[MaxPool
d=0
(λ),AvgPool
d=0
(λ)];
[0025]然后最大池化分支,将输入的特征图进行最大池化操作后再与原图相乘得到map2,扩大目标和背景的对比度;
[0026]然后平均池化分支,将输入的特征图进行平均池化操作后再与原图相乘得到map3,通过扩大感受野获取全局上下文语义信息;
[0027]最后残差分支,将原输入特征图和经过上述步骤得到的map1、map2、map3分别与对应的自适应权重相乘得到预测图。
[0028]优选的,所述计算每一轮网络输出的预测图和真值图之间的不确定性,计算不确定性损失,包括:
[0029]计算网络的平均预测图和真值图的之间的KL散度,利用KL散度计算不确定性损失,包括不确定性校准和不确定性最小化两部分;
[0030]计算每一轮网络输出的最终预测图和真值图之间的Soft

Iou损失。
[0031]优选的,所述将上一轮输出的预测图输入到下一轮网络中,且将上一轮每个结点包含的中间特征输入到下一轮网络的对应节点中,重复上述过程直至达到最大迭代次数结束搜索,包括:
[0032]将上一轮网络输出的最终预测图作为下一轮网络的输入;
[0033]将上一轮网络中每个结点保存的中间特征与当前网络中对应结点的特征相加,以增加检测准确性;
[0034]重复上述过程直至达到最大迭代次数结束搜索,得到最后的预测模型。
[0035]本专利技术还提供一种军事敏感区域迭代反馈红外目标检测模型建立装置,包括:
[0036]图像获取模块,其用于通过红外相机获取军事敏感区域目标图像;
[0037]特征提取模块,其用于对目标图像使用简化的骨干网络提取特征,得到每一轮初步的预测图;
[0038]特征增强模块,其用于将经过骨干网络得到的初步预测图输入到结合语义信息的多重注意力模块中,通过利用全局信息和注意力机制起到特征增强的作用;
[0039]图像计算模块,其用于计算每一轮网络输出的预测图和真值图之间的不确定性,计算不确定性损失;
[0040]图像迭代模块,其用于将上一轮输出的预测图输入到下一轮网络中,且将上一轮每个结点包含的中间特征输入到下一轮网络的对应节点中,重复上述过程直至达到最大迭代次数结束搜索。
[0041]本专利技术还提供一种电子设备,所述一种电子设备包括:
[0042]处理器、存储器,所述处理器、存储器与处理器进行通信连接;
[0043]所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种军事敏感区域迭代反馈红外目标检测模型建立方法,其特征在于,包括以下步骤:通过红外相机获取军事敏感区域目标图像;对目标图像使用简化的骨干网络提取特征,得到每一轮初步的预测图;将经过骨干网络得到的初步预测图输入到结合语义信息的多重注意力模块中,通过注意力机制并结合全局信息的方式进行特征增强;计算每一轮网络输出的预测图和真值图之间的不确定性,计算不确定性损失;将上一轮输出的预测图输入到下一轮网络中,且将上一轮每个结点包含的中间特征输入到下一轮网络的对应节点中,重复上述过程直至达到最大迭代次数结束搜索。2.根据权利要求1所述的一种军事敏感区域迭代反馈红外目标检测模型建立方法,其特征在于,所述通过红外相机获取军事敏感区域目标图像,包括:使用红外相机拍摄军事敏感区域目标图像,获得相应的源图像;对获得的目标图像进行人工标注,标记目标位置和形状得到真值图,用于网络的训练和验证。3.根据权利要求2所述的一种军事敏感区域迭代反馈红外目标检测模型建立方法,其特征在于,所述对目标图像使用简化的骨干网络提取特征,得到每一轮初步的预测图,包括:构成骨干网络的基础块使用通道空间注意力机制取代卷积块,通道空间注意力模块计算如下式所示:F

=M
s
(M
c
(F)
×
F)
×
(M
c
(F)
×
F)M
c
(F)=σ(MLP(AvgPool(F))+MLP(MaxPool(F)))M
s
(F)=σ(f7×7([AvgPool(F);MaxPool(F)]))其中,F代表输入的特征图,AvgPool和MaxPool分别代表平均池化和最大池化操作,MLP代表多层感知机,σ代表激活操作f7×7,代表卷积操作,F

代表输出的特征图。4.根据权利要求2所述的一种军事敏感区域迭代反馈红外目标检测模型建立方法,其特征在于,所述将经过骨干网络得到的初步预测图输入到结合语义信息的多重注意力模块中,通过利用全局信息和注意力机制起到特征增强的作用,包括:将经过骨干网络得到的预测图输入到三重注意力机制中,计算C、W、H三个维度之间两两成对的依赖关系,将三个分支得到的特征图相加得到map1;其中λ1代表输入的原特征,和代表将输入特征沿W轴和H轴沿逆时针旋转90
°
得到的特征,σ代表激活操作,φ代表卷积层,Z表示Z

pool层,d=0代表在张量的第0维进行操作,即:Z(λ)=[MaxPool
d=0

【专利技术属性】
技术研发人员:魏明强翁张莹燕雪峰
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1