【技术实现步骤摘要】
本专利技术涉及模式识别
,尤其是一种基于子空间的自步跨模态匹配方法。
技术介绍
现实中的数据往往具有多种模态。比如网页数据既包含图片信息,又包含文本信息;视频数据同时包含音频信息和图片信息。跨模态匹配的根本任务是以一种模态作为查询条件,匹配出与之相似的异质模态信息。传统跨模态匹配方法大多是监督学习方法,它们都是通过语义标签来减少异质模态之间的鸿沟,但是无法处理无标签信息,人工标记数据又是一个费时费力的工作。此外,有些无监督的方法没有考虑特征的判定性和相关性和样本间的语义相似性,无法满足人们的日常需求。因此亟需一种高效的无监督跨模态匹配方法。
技术实现思路
本专利技术目的在于解决上述技术问题而提供一种基于子空间的无监督自步跨模态匹配方法,能有效地跨越不同模态媒体之间的语义鸿沟,进而使得跨媒体搜索引擎返回的结果更加准确。本专利技术是这样实现的,一种基于子空间的自步跨模态匹配方法,包括步骤:S1,收集不同模态的数据样本建立跨模态数据库,并将所述跨模态数据库分为训练集和测试集;S2,提取所述跨模态数据库中不同模态数据样本的特征向量;S3,基于所述训练集中不同模态数据的特征向量,得到与所述不同模态分别对应的映射矩阵;S4,利用所述映射矩阵将所述测试集中数据样本的模态类别映射到同一空间;S5,将映射到同一空间的测试集中同一模态类别的数据作为查询集,另一模态类别的数据作为目标集;S6,通过度量数据间的相似度,在所述目标集中查询与所述查询集中的一个数据样本相匹配的数据,从而得到跨模态匹配的结果。根据本专利技术的方法,可以将不同模态的多媒体数据映射入统一空间进行度量,且 ...
【技术保护点】
一种基于子空间的自步跨模态匹配方法,其特征在于,包括步骤:S1,收集不同模态的数据样本建立跨模态数据库,并将所述跨模态数据库分为训练集和测试集;S2,提取所述跨模态数据库中不同模态数据样本的特征向量;S3,基于所述训练集中不同模态数据的特征向量建立目标函数并求解目标函数,得到与所述不同模态分别对应的映射矩阵;S4,利用所述映射矩阵将所述测试集中数据样本的模态类别映射到同一空间;S5,将映射到同一空间的测试集中同一模态类别的数据作为查询集,另一模态类别的数据作为目标集;S6,通过度量数据间的相似度在所述目标集中查询与所述查询集中的一个数据样本相匹配的数据,从而得到跨模态匹配的结果。
【技术特征摘要】
1.一种基于子空间的自步跨模态匹配方法,其特征在于,包括步骤:S1,收集不同模态的数据样本建立跨模态数据库,并将所述跨模态数据库分为训练集和测试集;S2,提取所述跨模态数据库中不同模态数据样本的特征向量;S3,基于所述训练集中不同模态数据的特征向量建立目标函数并求解目标函数,得到与所述不同模态分别对应的映射矩阵;S4,利用所述映射矩阵将所述测试集中数据样本的模态类别映射到同一空间;S5,将映射到同一空间的测试集中同一模态类别的数据作为查询集,另一模态类别的数据作为目标集;S6,通过度量数据间的相似度在所述目标集中查询与所述查询集中的一个数据样本相匹配的数据,从而得到跨模态匹配的结果。2.根据权利要求1所述方法,其特征在于,所述不同模态为双模态。3.根据权利要求2所述方法,其特征在于...
【专利技术属性】
技术研发人员:赫然,孙哲南,李志航,梁坚,曹冬,
申请(专利权)人:天津中科智能识别产业技术研究院有限公司,
类型:发明
国别省市:天津;12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。