一种Transformer多模态数据特征融合方法技术

技术编号：38256327 阅读：8 留言：0更新日期：2023-07-27 10:19

本发明专利技术公开了一种Transformer多模态数据特征融合方法,方法包括：通过浅层空谱特征解译模块进行第一次上下文优化，根据从LiDAR数据获得的局部空间掩膜作为引导信息，从光谱信息到空间信息提取浅层多模态特征；通过中层自适应特征融合模块进行第二次上下文特征融合，使用自适应交叉Transformer融合多个数据源的CLS标记，得到协作抽象信息；根据浅层多模态特征和协作抽象信息，通过高层多阶段特征传递模块进行第三次交叉融合，得到最终全局特征融合结果。本发明专利技术更可靠更灵活，可广泛应用于计算机技术领域。机技术领域。机技术领域。

全部详细技术资料下载

【技术实现步骤摘要】
一种Transformer多模态数据特征融合方法

[0001]本专利技术涉及计算机
，尤其是一种Transformer多模态数据特征融合方法。

技术介绍

[0002]随着传感器技术的发展，多模态数据融合在场景理解和目标识别中发挥着重要作用，融合感知已然成为学科的重要发展方向，被广泛应用于道路分类和医学图像处理等众多领域。经典的机器学习数据融合方法使用手工制作的特征进行融合分类，其往往根据特定的领域知识所设计，限制了在不同数据集的移植性。相比之下，基于深度学习的技术可以在没有先验知识的情况下提取从浅纹理到深抽象特征的判别特征，可移植性优于传统模型。目前，基于深度学习的技术已经取得了很大的进展，并已成为多模态数据融合分类的重要技术手段。
[0003]基于深度学习的多模式数据融合分类有两种，即多分支特征叠加融合策略和上下文感知特征交叉融合策略。前者使用非重叠网络分支独立学习多模态异构特征。相比之下，上下文感知特征交叉结构通过每个模态使用上下文感知交叉和信息引导同时学习多模态特征，在多模式特征表达方面具有更重要的能力。然而现有网络忽略了早期特征提取阶段局部特征融合过程中上下文融合策略的必要性，即缺乏全局上下文感知特征传输。

技术实现思路

[0004]有鉴于此，本专利技术实施例提供一种灵活度高且精度高的Transformer多模态数据特征融合方法。
[0005]本专利技术实施例的一方面提供了一种Transformer多模态数据特征融合方法，包括：
[0006]通过浅层空谱特征解译模...

【技术保护点】

【技术特征摘要】
1.一种Transformer多模态数据特征融合方法，其特征在于，包括：通过浅层空谱特征解译模块进行第一次上下文优化，根据从LiDAR数据获得的局部空间掩膜作为引导信息，从光谱信息到空间信息提取浅层多模态特征；通过中层自适应特征融合模块进行第二次上下文特征融合，使用自适应交叉Transformer融合多个数据源的CLS标记，得到协作抽象信息；根据所述浅层多模态特征和所述协作抽象信息，通过高层多阶段特征传递模块进行第三次交叉融合，得到最终全局特征融合结果。2.根据权利要求1所述的一种Transformer多模态数据特征融合方法，其特征在于，所述通过浅层空谱特征解译模块进行第一次上下文优化，根据从LiDAR数据获得的局部空间掩膜作为引导信息，从光谱信息到空间信息提取浅层多模态特征，包括:使用光谱注意力模块确定单个图像通道维度的全局相关性；根据单个图像通道维度的全局相关性，引入动态区域感知策略生成LiDAR的引导掩膜；根据所述引导掩膜作为引导信息，对图像特征的空间区分能力进行增强处理。3.根据权利要求2所述的一种Transformer多模态数据特征融合方法，其特征在于，所述使用光谱注意力模块确定单个图像通道维度的全局相关性，包括:对输入HSI图像特征X
HSI
施加d维的注意力向量得到光谱增强特征；根据所述光谱增强特征，确定每个训练样本的HSI数据和LiDAR数据。4.根据权利要求2所述的一种Transformer多模态数据特征融合方法，其特征在于，所述根据单个图像通道维度的全局相关性，引入动态区域感知策略生成LiDAR的引导掩膜，包括:使用带有ReLu激活函数的卷积层对LiDAR数据提取特征；基于数据依赖机制从输入特征学习LiDAR的引导掩膜。5.根据权利要求2所述的一种Transformer多模态数据特征融合方法，其特征在于，所述根据所述引导掩膜作为引导信息，对图像特征的空间区分能力进行增强处理，包括：计算HSI图像的增强特征；将HSI通道分为多个组,每组共享一个Class Token标记，通过沿通道域的局部光谱嵌入细化通道属性表示，完成LiDAR特征增强。6.根据权利要求1所述的一种Transformer多模态数据特征融合方法，其特征在于，所述通过中层自适应特征融合模块进行第二次上下文特征融合，使用自适应交叉Transformer融合多个数据源的CLS标记，得到协作抽象信息，包括：将MHT编码器应用于HSI数据，并将MLT编码器应用于LiDAR数据，得到光谱特征和空间特征；根据自适应CLS标记混合器机制，将不同组的HSI数据的CLS标记分别与L...

【专利技术属性】
技术研发人员：谭晓军，王锦萍，张乐天，陈楠杰，黄佳健，王薛强，
申请(专利权)人：广州文远知行科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人