一种分布一致的缺失模态恢复方法技术

技术编号:42239175 阅读:29 留言:0更新日期:2024-08-02 13:51
本发明专利技术提供的一种分布一致的缺失模态恢复方法,所述恢复方法包括:收集多模态数据集;设计一种分布一致的缺失模态恢复网络;利用训练数据对网络进行训练,获得训练模型;根据所述训练模型生成多模态缺失数据恢复模型;利用多模态特征进行模态融合与预测。能够很好地预测缺失模态的分布空间,进一步提高恢复质量。恢复的模态和可用的模态输入到多模态融合与预测网络以用于下游任务。

【技术实现步骤摘要】

本专利技术涉及多模态学习、机器学习领域,尤其涉及一种分布一致的缺失模态恢复方法


技术介绍

1、多模态机器学习致力于通过融合语言、声音、图像等多模态数据来设计一个强大的理解、推理和学习模型。这种丰富的多模态数据有利于理解人类的行为和意图,在智能辅导系统和机器人技术等领域具有广泛的应用前景和价值。然而,在一些受限的场景中,一些模态数据可能会丢失。例如,由于语音识别错误,语言模态数据可能无法使用;音频数据可能由于背景噪声而缺失;视觉数据可能由于照明、遮挡或社会隐私安全等问题导致该模态数据不能使用。在实际应用中,模态缺失的问题通常会降低多模态任务的性能。因此如何缓解模态缺失问题成为亟需解决的问题。目前的解决方法主要是“基于非补全的方法”和“基于补全的方法”,具体有:

2、1)基于非补全的方法。主要技术手段:寻找一个多模态数据共享的相关性最大的子空间,然后将可用模态数据映射到此空间来一致表达所有模态数据。问题和缺点:这些方法忽略了多模态数据的异构性所带来的互补性,造成次优的下游任务性能。

3、2)基于补全的方法。主要技术手段:首先设计一个编本文档来自技高网...

【技术保护点】

1.一种分布一致的缺失模态恢复方法,其特征在于,所述恢复方法包括:

2.根据权利要求1所述的一种分布一致的缺失模态恢复方法,其特征在于,所述收集多模态数据集具体包括:

3.根据权利要求1所述的一种分布一致的缺失模态恢复方法,其特征在于,所述设计一种分布一致的缺失模态恢复网络具体包括:

4.根据权利要求3所述的一种分布一致的缺失模态恢复方法,其特征在于,所述浅层特征提取器E包含三个独立的时序卷积层来接收三个模态的输入数据,分别为:语言数据L,视觉数据V和音频数据A,并输出浅层特征m∈{L,V,A}表示一个模态,Xm表示为:

>5.根据权利要求3...

【技术特征摘要】

1.一种分布一致的缺失模态恢复方法,其特征在于,所述恢复方法包括:

2.根据权利要求1所述的一种分布一致的缺失模态恢复方法,其特征在于,所述收集多模态数据集具体包括:

3.根据权利要求1所述的一种分布一致的缺失模态恢复方法,其特征在于,所述设计一种分布一致的缺失模态恢复网络具体包括:

4.根据权利要求3所述的一种分布一致的缺失模态恢复方法,其特征在于,所述浅层特征提取器e包含三个独立的时序卷积层来接收三个模态的输入数据,分别为:语言数据l,视觉数据v和音频数据a,并输出浅层特征m∈{l,v,a}表示一个模态,xm表示为:

5.根据权利要求3所述的一种分布一致的缺失模态恢复方法,其特征在于,所述跨模态分布...

【专利技术属性】
技术研发人员:王慧勇李勇李竞元史鹏飞钟鸿豪山世光山盛高黎明刘壮杨茹茵高科申一中
申请(专利权)人:中科视拓北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1