多层次跨模态协同特征编码器结构制造技术

技术编号:43369358 阅读:34 留言:0更新日期:2024-11-19 17:50
本发明专利技术聚焦于多模态图像融合领域,提出一种多层次跨模态协同特征编码器结构。步骤1:将红外数据集与可见光数据集进行尺寸归一化处理;步骤2:将红外图像和可见光图像分别输入到Transformer进行初步融合及提取特征;步骤3:将红外图像和可见光图像输入到CNN网络进行融合及提取特征;步骤4:将两种网络提取出的特征通过CBAM模块进行空间和通道注意力加权后融合。在本发明专利技术中,针对多模态特征融合效果不佳的问题,将两种网络分别提取特征后通过CBAM模块进行空间和通道注意力加权,有效保留红外图像在低光、夜间等恶劣情况下的热辐射信息和可见光图像的细节和颜色信息,可用于军事侦察、安防系统、医学诊断等领域。

【技术实现步骤摘要】

本专利技术涉及多模态图像融合领域,特别涉及一种在transformer、cnn结构中加入特征融合部分并通过cbam注意力模块进行特征融合,增强融合多模态特征的能力的一种多模态图像融合方法。


技术介绍

1、在当代多模态图像融合领域,提升多模态图像特征的提取能力一直是热门问题。然而,传统的多模态图像融合方法往往面临着特征提取不充分、特征融合效果不佳等问题。为了克服这些问题,多层次跨模态协同特征编码器结构结合了transformer擅长处理长距离依赖关系和全局信息,能够捕捉到图像中的全局特征和复杂的上下文关系和cnn擅长捕捉局部特征和细节的优势,并引入cbam注意力机制,以提升在复杂环境下的鲁棒性和生成图像的质量,使生成图像更加多样化和真实。

2、在多模态融合领域,cnn以其出色的特征提取和表达能力成为主流,但其局限性在于对全局信息的建模能力有限;transformer具备丰富的全局细节捕捉能力,将transformer和cnn结合分别处理红外图像和可见光图像可以极大程度地保留每种模态的细节和优点。在多层次跨模态协同特征编码与权重融合网络中,红外图像本文档来自技高网...

【技术保护点】

1.一种多层次跨模态协同特征编码器结构,包括以下步骤:

2.根据权利要求1所述的一种多层次跨模态协同特征编码器结构,其特征在于,所述步骤204中,在将来自两种模态切片后的ptach输入到Transformer编码器后,分别提取第一层,第三层,第六层和第十二层,这样的特征选取可以增强多模态特征的融合,捕捉到的信息具有不同的尺度和抽象程度,增强多尺度特征融合能力。

3.根据权利要求1所述的一种多层次跨模态协同特征编码器结构,其特征在于,所述步骤205中,将Transformer编码器输出的两种模态的f1、f2、f3、f4依次通过逐元素相加和卷积层进行特征融合,在Tra...

【技术特征摘要】

1.一种多层次跨模态协同特征编码器结构,包括以下步骤:

2.根据权利要求1所述的一种多层次跨模态协同特征编码器结构,其特征在于,所述步骤204中,在将来自两种模态切片后的ptach输入到transformer编码器后,分别提取第一层,第三层,第六层和第十二层,这样的特征选取可以增强多模态特征的融合,捕捉到的信息具有不同的尺度和抽象程度,增强多尺度特征融合能力。

3.根据权利要求1所述的一种多层次跨模态协同特征编码器结构,其特征在于,所述步骤205中,将transformer编码器输出的两种模态的f1、f2、f3、f4依次通过逐元素相加和卷积层进行特征融合,在transformer特征提取中加了来自两种模态图像特征融合的部分,融合后的特征图包含了更加丰富的信息,可以提升特征表示能力和捕获更多细节。

4.根据权利要求1所述的一种多层次跨模态协同特征编码器结构,其特征在于,所述步骤304中,将来自可见光图像的f1(1)、f2(1)、f3(1)、f4(1)红外图像的f1(2)、f2(2)、f3(2)、...

【专利技术属性】
技术研发人员:刘明珠孟祥博
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1