多模态图像特征融合方法、装置以及设备制造方法及图纸

技术编号：37042453 阅读：26 留言：0更新日期：2023-03-29 19:21

本公开提供了一种多模态图像特征融合方法、装置以及设备，涉及人工智能技术领域，具体涉及图像处理和深度学习等技术领域，可应用于自动巡航。该方法的一具体实施方式包括：获取多个模态的图像；将多个模态的图像输入至特征提取网络，得到多个模态的图像的多尺度特征图，其中，特征提取网络包括多个分支，每个分支输出一个尺度的特征图；对多个模态的图像的多尺度特征图进行融合，得到多模态融合特征图。该实施方式提高了多模态特征融合的精度。该实施方式提高了多模态特征融合的精度。该实施方式提高了多模态特征融合的精度。

全部详细技术资料下载

【技术实现步骤摘要】
多模态图像特征融合方法、装置以及设备

[0001]本公开涉及人工智能
，具体涉及图像处理和深度学习
，可应用于自动巡航。

技术介绍

[0002]传感器的图像感知技术是巡航的一个极其重要的功能。对于普通场景的自动巡航，通常使用基于光学传感器获得的彩色影像可以进行图像感知。但是，对于复杂场景的自动巡航，使用单一传感器存在着许多隐患。例如，使用常规的彩色影像仅能获得外部场景的光学信息，在光照条件弱的场景下将面临着精度下降、解译能力差等问题。

技术实现思路

[0003]本公开实施例提出了一种多模态图像特征融合方法、装置、设备、存储介质以及程序产品。
[0004]第一方面，本公开实施例提出了一种多模态图像特征融合方法，包括：获取多个模态的图像；将多个模态的图像输入至特征提取网络，得到多个模态的图像的多尺度特征图，其中，特征提取网络包括多个分支，每个分支输出一个尺度的特征图；对多个模态的图像的多尺度特征图进行融合，得到多模态融合特征图。
[0005]第二方面，本公开实施例提出了一种多模态图像特征融合装置，包括：获取模块，被配置成获取多个模态的图像；提取模块，被配置成将多个模态的图像输入至特征提取网络，得到多个模态的图像的多尺度特征图，其中，特征提取网络包括多个分支，每个分支输出一个尺度的特征图；融合模块，被配置成对多个模态的图像的多尺度特征图进行融合，得到多模态融合特征图。
[0006]第三方面，本公开实施例提出了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接...

【技术保护点】

【技术特征摘要】
1.一种多模态图像特征融合方法，包括：获取多个模态的图像；将所述多个模态的图像输入至特征提取网络，得到所述多个模态的图像的多尺度特征图，其中，所述特征提取网络包括多个分支，每个分支输出一个尺度的特征图；对所述多个模态的图像的多尺度特征图进行融合，得到多模态融合特征图。2.根据权利要求1所述的方法，所述特征提取网络的特征提取过程包括多个阶段；以及所述将所述多个模态的图像输入至特征提取网络，得到多个模态的图像的多尺度特征图，包括：对于第一阶段，对所述多个模态的图像进行下采样特征提取，得到第一阶段的多个特征图；对于第一阶段之后的一个阶段，对上一阶段的多个特征图进行下采样特征提取和原尺度特征提取，得到本阶段的多个特征图。3.根据权利要求2所述的方法，其中，第一阶段之后的一个阶段的多个特征图包括至少一个下采样特征图和至少一个原尺度特征图；以及所述对上一阶段的多个特征图进行下采样特征提取和原尺度特征提取，得到本阶段的多个特征图，包括：将上一阶段的至少一个下采样特征图分别输入至本阶段的下采样特征提取层和原尺度特征提取层，以及将上一阶段的至少一个原尺度特征图输入至本阶段的原尺度特征提取层，得到本阶段的至少一个下采样特征图和至少一个原尺度特征图。4.根据权利要求2所述的方法，其中，所述将所述多个模态的图像输入至特征提取网络，得到多个模态的图像的多尺度特征图，还包括：对于本阶段的一个模态的图像的一个尺度的特征图，将本阶段的该模态的图像的该尺度的特征图与上一阶段的其他模态的图像的该尺度的特征图进行融合，替代本阶段的该模态的图像的该尺度的特征图。5.根据权利要求4所述的方法，其中，所述将本阶段的该模态的图像的该尺度的特征图与上一阶段的其他模态的图像的该尺度的特征图进行融合，替代本阶段的该模态的图像的该尺度的特征图，包括：将本阶段的该模态的图像的该尺度的特征图与上一阶段的其他模态的图像的该尺度的特征图进行级联，得到该模态的图像的该尺度的级联特征图；通过注意力机制获取该模态的图像的该尺度的级联特征图的通道权重；利用所述通道权重对该模态的图像的该尺度的级联特征图进行增强，得到该模态的图像的该尺度的增强特征图；对该模态的图像的该尺度的增强特征图进行降维，替代本阶段的该模态的图像的该尺度的特征图。6.根据权利要求1所述的方法，其中，所述对所述多个模态的图像的多尺度特征图进行融合，得到多模态融合特征图，包括：将所述多个模态的图像的多尺度特征图采样到相同尺度，得到所述多个模态的图像的相同尺度特征图；对所述多个模态的图像的相同尺度特征图进行级联，得到所述多模态融合特征图。
7.根据权利要求6所述的方法，其中，所述将所述多个模态的图像的多尺度特征图采样到相同尺度，得到所述多个模态的图像的相同尺度特征图，包括：确定所述多个模态的图像的多尺度特征图中的最大尺度的特征图；将其他尺度的特征图上采样到与所述最大尺度的特征图相同的尺度，得到所述多个模态的图像的相同尺度特征图。8.一种多模态图像特征融合装置，包括：获取模块，被配置成获取多个模态的图像；提取模块，被配置成将所述多个模态的图像输入至特征提取网络，得到所述多个模态的图像的...

【专利技术属性】
技术研发人员：马施彬，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人