【技术实现步骤摘要】
一种基于Y型金字塔网络的多谱段图像融合方法
[0001]本专利技术涉及异源图像融合领域,特别涉及一种用于视觉导引的基于卷积神经网络和注意力机制的多谱段图像融合方法。
技术介绍
[0002]基于计算机视觉的导引系统是计算机视觉工程应用的一个方面。由于它导引精度较高,不受无线电波干扰,设备价格较低廉,并且可以根据环境的具体情况对导引轨迹进行自主调整,近几年来被广泛地应用到国防、航天、消防、工业、交通等工程实践中。
[0003]视觉导引系统,是将视觉目标信息获取设备作为主要制导传感器的一类导引系统,通过对视觉图像的理解,自动地,实时地导引某个设备按任务轨迹移动的系统。导引目标的提取、描述、识别和跟踪都是基于对图像的处理实现的,因此,获得一幅全面、清晰、目标显著的图像至关重要。现存的单波段视觉导引系统易受外界环境影响,稳定性差,导引精度低甚至会出现失效的情况。多谱段视觉导引系统可以同时采集多个谱段的图像,经过融合后可以利用多个传感器提供的冗余信息,提高导引的精确性和准确性。同时,融合图像具有较强的鲁棒性,即使个别传感器故障也不会对融合图像产生严重影响。融合后的图像包含更为全面、丰富的信息,更有利于对目标的识别和检测。以红外和可见光双波段视觉导引系统为例,可见光图像捕捉目标的反射信息,具有较高的空间分辨率和图像对比度,适合人类感知,但易受到恶劣环境的影响如:光照不足的夜晚、大雾天气等;而红外光图像捕捉目标的热辐射信息,有良好的环境抗干扰能力,但对比度较低,图像细节较差。
[0004]为此,亟需提供一种能够解决上 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种基于Y型金字塔网络的多谱段图像融合方法,其特征在于,包括以下步骤:S1:获取训练集、扩增训练集;S2:构建Y型网络;所述Y型网络包括:分支网络、主支网络;所述分支网络采用金字塔网络分别提取可见光图像特征和红外光图像特征,所述主支网络融合所述分支网络提取的可见光图像特征和红外光图像特征;S3:将训练集输入所述分支网络对所述分支进行训练,根据损失函数对所述主支网络进行训练,得到完成训练的所述Y型网络;S4:将可见光图像特征和红外光图像特征输入完成训练的所述Y型网络生成融合图像。2.根据权利要求1所述一种基于Y型网络的多谱段图像融合方法,其特征在于,所述S1:获取训练集、扩增训练集的具体内容为:从TNO数据集中随机选取n对已配对的红外与可见光图像对作为训练集;在训练时,对从所述TNO数据集中获取的原始红外和可见光图像进行随机裁剪作为扩增训练集。3.根据权利要求1所述一种基于Y型网络的多谱段图像融合方法,其特征在于,所述分支网络包括:红外分支网络、可见光分支网络;所述红外分支网络结构为:第一层,特征提取卷积层;第二层,一个二层残差金字塔卷积块、卷积注意力模块、批量归一化层、激活函数为P
‑
relu的激活层;第三层:一个三层残差金字塔卷积块、卷积注意力模块、批量归一化层、激活函数为P
‑
relu的激活层;第四层:一个四层残差金字塔卷积块、卷积注意力模块、批量归一化层、激活函数为P
‑
relu的激活层;所述可见光分支网络结构为:第一层,特征提取卷积层;第二层,一个二层残差金字塔卷积块、批量归一化层、激活函数为P
‑
relu的激活层;第三层:一个三层残差金字塔卷积块、批量归一化层、激活函数为P
‑
relu的激活层;第四层:一个四层残差金字塔卷积块、批量归一化层、激活函数为P
‑
relu的激活层。4.根据权利要求1所述一种基于Y型网络的多谱段图像融合方法,其特征在于,所述主支网络结构包括三层卷积神经网络;所述卷积神经网络结构为:卷积层
‑
批量归一化层
‑
激活函数为P
‑
relu的激活层。5.根据权利要求1所述的一种基于Y型网络的多谱段图像融合方法,其特征在于,所述损失函数表达式为:Loss=L
gen
+λL
res
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中,L
技术研发人员:郭惠楠,姚志强,
申请(专利权)人:中国科学院西安光学精密机械研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。