【技术实现步骤摘要】
基于特征空间多分类对抗机制的红外可见光图像融合方法
[0001]本专利技术涉及图像增强
,具体地说,本专利技术涉及一种基于特征空间多 分类对抗机制的红外可见光图像融合方法的技术方案。
技术介绍
[0002]近几十年,基于深度学习的融合方法凭借神经网络强大的特征提取和图像重 建能力,获得了远超传统方法的性能。现存的基于深度学习的图像融合方法可以 分为端到端融合方法以及非端到端融合方法。
[0003]端到端融合方法通常直接使用一个整体网络将输入的红外和可见光图像进 行融合。换句话说,融合的各个阶段如特征提取、特征融合以及图像重建都是隐 式的。端到端融合方法可根据所采取的架构分为基于卷积神经网络的融合方法和 基于生成式对抗网络的融合方法。这些方法的共性在于依赖融合图像与源图像绝 对分布之间的距离损失。例如,PMGI在融合图像和两个源图像间建立强度和梯 度距离损失,并通过调节损失项的权重系数来调整信息融合过程中的保留比例, 从而控制融合绝对结果分布的倾向性。U2Fusion则在融合图像和两个源图像间 建立强度和结构相似度损失,并通过度量特征图的信息质量来自适应地调整损失 项系数,从而引导融合图像保留有效信息。不幸的是,这种融合图像与两个源图 像绝对分布之间的距离损失会建立一个博弈,导致最终融合图像是两个源图像原 始属性(如像素强度、梯度等)的折中,不可避免地造成有益信息被削弱。除此 以外,FusionGAN网络的优化不仅依赖图像绝对分布之间的距离损失还依赖模 态概率分布之间的对抗损失。随后,它们引入双鉴别器来平 ...
【技术保护点】
【技术特征摘要】
1.基于特征空间多分类对抗机制的红外可见光图像融合方法,其特征在于,包括如下步骤:步骤1,设计一种新的自编码器网络来实现融合过程中的特征提取和图像重建,所述的自编码器网络包括编码器和译码器,其中编码器将图像映射到高维特征空间,再利用译码器将高维特征重新映射为图像,设计损失函数对编码器和译码器进行训练;步骤2,建立生成式对抗网络并对其进行训练,所述的生成式对抗网络包括特征融合网络和和多分类鉴别器,使用训练好的编码器从红外和可见光图像中提取特征,然后通过生成式对抗网络来融合这些特征;步骤3,在整个训练结束后,将编码器、生成式对抗网络以及译码器级联组成完整的图像融合网络,使用训练好的编码器从红外和可见光图像中提取特征,将生成式对抗网络生成的融合特征经训练好的译码器译码得到高质量的融合图像。2.如权利要求1所述的基于特征空间多分类对抗机制的红外可见光图像融合方法,其特征在于:步骤1中编码器的网络结构如下;建立编码器E,所述的编码器E使用跳跃连接和残差连接通过9个卷积层对原始的红外图像和可见光图像对中提取特征,所述的卷积层的卷积核尺寸均为3
×
3,激活函数均为Leaky ReLU,分别采用空间注意力模块对第4层和第8层卷积层加权;采用残差连接将第1层与第一个空间注意力模块进行残差连接,残差连接的结果通过激活函数Leaky ReLU后与第二个空间注意力模块进行残差连接;采用跳跃连接将第2层、第3层、第6层与第7层进行跳跃连接,最终得到红外特征Fea
ir
和可见光特征Fea
vis
。3.如权利要求1所述的基于特征空间多分类对抗机制的红外可见光图像融合方法,其特征在于:步骤1中译码器的网络结构如下;建立译码器D,所述的译码器D使用两个结合通道注意力模块的多尺度卷积层顺序连接,来处理编码器提取的编码特征,所述的多尺度卷积层由三个具有不同尺寸卷积核的卷积层组成,卷积核尺寸分别为7
×
7、5
×
5和3
×
3,激活函数均为Leaky ReLU;在每个多尺度卷积层后连接一个通道注意力模块,在此之后,使用三个卷积核尺寸为3
×
3的卷积层来重建红外图像和可见光图像,前两个卷积层使用Leaky ReLU作为激活函数,第三个卷积层使用Tanh作为激活函数。4.如权利要求1所述的基于特征空间多分类对抗机制的红外可见光图像融合方法,其特征在于:建立编码器和译码器的损失函数其为在强度域和梯度域构建重建图像与输入图像的一致性损失,其计算公式如下:其中,是强度损失,是梯度损失,β是平衡强度损失项和梯度损失项的参数;强度损失的计算公式如下:梯度损失的计算公式如下:
其中,|
·
|是范数,是Sobel梯度算子,其从水平和竖直两个方向来计算图像的梯度;I
ir
和I
vis
是输入的源红外和可见光图像,和是自编码网络重建的红外和可见光图像,其可以表示为:训练编码器和译码器,采用Adam优化器来更新参数,训练好后,冻结其参数。5.如权利要求1所述的基于特征空间多分类对抗机制的红外可见光图像融合方法,其特征在于:步骤2的具体实现方式如下;步骤2.1,建立特征融合网络F,将训练好的编码器E提取的红外特征Fea
ir
和可见光特征Fea
vis
进行融合,生成融合特征Fea
fused
;所述的特征融合网络F采用3个卷积核尺寸为3
×
3、激活函数为Leaky Relu的卷积层来处理编码器E提取的红外特征Fea
ir
与可见光特征Fea
vis
;在此之后级联三个并列的两层卷积层分支,分别是2个融合权重预测分支和一个偏差预测分支,预测融合权重ω
ir
、ω
vis
以及偏差项ε;所述的融合权重预测分支包含两个卷积层,其卷积尺寸均为3
×
3,两个卷积层分别使用Leaky Relu和Sigmoid作为激活函数;在偏差预测分支,也包含两个卷积层,其卷积尺寸均为3
×
3,两个卷积层的激活函数均为Leaky Relu;融合特征可以被表示为:Fea
fused
=F(Fea
ir
,Fea
vis
)=ω
ir
·
Fea
ir
+ω
vis
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。