【技术实现步骤摘要】
本专利技术属于多模态数据处理领域,具体地,涉及数据空间中基于语义增强的多模态嵌入表示学习方法。
技术介绍
1、随着人工智能技术的发展,尤其是计算机视觉、语音识别、自然语言处理等领域的突破,多模态学习逐渐成为一种重要的研究方向。多模态学习旨在通过融合文本、图像、视频和音频等不同模态的数据,提高对复杂数据的理解能力和决策能力。在多模态学习的过程中,一个核心问题是如何将来自不同模态的数据转化为统一的表示,以便于后续的分析和处理。
2、近年来,数据空间作为一种新兴的数据管理和共享概念已引起广泛关注,它提供了一种标准化的数据存储、组织和访问方式,使不同来源、不同格式的数据能够被高效整合和利用。在数据空间中,多模态数据可以以结构化或非结构化的形式存储,并通过统一的语义描述进行标注,从而支持更高效的多模态数据融合与表示学习。现有传统的多模态学习方法通常依赖于不同模态的单独表示,并通过某些形式的对齐技术进行融合。然而,这些方法仍面临一些挑战。
3、一是模态间的语义不一致性。不同模态的数据(如文本、图像、音频、视频等)通常采用不同
...【技术保护点】
1.数据空间中基于语义增强的多模态嵌入表示学习方法,其特征在于:
2.根据权利要求1所述方法,其特征在于:
3.根据权利要求2所述方法,其特征在于:在步骤2中,在提取特征之前需要先训练CLIP模型和VGGish模型;
4.根据权利要求3所述方法,其特征在于:VGGish模型的预训练过程为:
5.根据权利要求4所述方法,其特征在于:在步骤2中,
6.根据权利要求5所述方法,其特征在于:在步骤3中,包括:
7.根据权利要求6所述方法,其特征在于:在步骤4中,包括:
8.一种用于执行如权利要
...【技术特征摘要】
1.数据空间中基于语义增强的多模态嵌入表示学习方法,其特征在于:
2.根据权利要求1所述方法,其特征在于:
3.根据权利要求2所述方法,其特征在于:在步骤2中,在提取特征之前需要先训练clip模型和vggish模型;
4.根据权利要求3所述方法,其特征在于:vggish模型的预训练过程为:
5.根据权利要求4所述方法,其特征在于:在步骤2中,
6.根据权利要求5所述方法,其特征在于:在步骤3中,包括:
7.根据权利...
【专利技术属性】
技术研发人员:韩启龙,李丽洁,乔天,於志文,宋洪涛,
申请(专利权)人:哈尔滨工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。