当前位置: 首页 > 专利查询>天津中科智能识别产业技术研究院有限公司专利>正文

一种基于子空间学习的不完整跨模态检索方法技术

技术编号：15639456 阅读：718 留言：0更新日期：2017-06-15 23:40

本发明专利技术公开一种基于子空间学习的不完整跨模态检索方法，该方法通过收集多模态数据并提取特征；构造不完整观测的多模态数据集合；基于回归方式学习不完整观测多模态数据集共享子空间表达；对不同模态数据集进行特征学习以选择出具有较强判别能力的特征；挖掘不完整观测模态间和模态内相似性关系，建立优化目标函数；优化目标函数得到多模态数据共享子空间表达及基于回归方式的投影矩阵；根据投影矩阵进行跨模态检索。本发明专利技术解决了模态间特征异质的问题,同时可充分利用具有完整模态和不完整模态的数据，增强了跨模态检索性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于子空间学习的不完整跨模态检索方法
本专利技术涉及跨模态检索
，尤其是一种基于子空间学习的不完整跨模态检索方法。
技术介绍
随着多媒体技术的迅猛发展，用户每天都分享着海量的多媒体信息，如图像、文本和视频。往往同一语义的数据由以上多种媒体特征进行描述，如一个网页可以由文本，图片和超级链接进行表征。以上多媒体数据的爆炸式增长，极大地促进了跨模态检索的应用需求，如用文本检索图片或者用图片检索文本等。因此，跨模态检索具有极其重要的研究和应用价值。传统跨模态检索方法一般假设每一个数据点都具有完整的多模态表达，如由网页组成的数据集合，每一个网页都有完整的文本模态表达和图像模态表达。然而，在更为一般的场景中，一些数据点可能仅有部分的多模态表达，而只有部分数据点包含完整的多模态表达，这样的数据集合称之为不完整观测多模态数据。在上述场景中，传统跨模态检索方法一般仅使用具有完整多模态表达的数据点进行建模，不能有效使用那些包含部分模态特征的数据点。因此，传统跨模态检索方法不能有效处理不完整跨模态检索问题。
技术实现思路
本专利技术的目的在于解决上述技术问题而提出一种基于子空间学习的不完整跨模态检索方法，以解决现有跨模态检索方法不能有效满足不完整跨模态检索的需求的问题。本专利技术是这样实现的，一种基于子空间学习的不完整跨模态检索方法，包括步骤：步骤S1，收集多模态数据并分别提取各模态的特征；步骤S2，利用提取的各模态的特征构造不完整观测多模态数据集；步骤S3，基于回归方式学习不完整观测多模态数据集共享子空间表达，并分别学习各模态数据线性投影矩阵；步骤S4，通过各模态数据线...
一种基于子空间学习的不完整跨模态检索方法

【技术保护点】
一种基于子空间学习的不完整跨模态检索方法，其特征在于，包括步骤：步骤S1，收集多模态数据并分别提取各模态的特征；步骤S2，利用提取的各模态的特征构造不完整观测多模态数据集；步骤S3，基于回归方式学习不完整观测多模态数据集共享子空间表达，并分别学习各模态数据线性投影矩阵；步骤S4，通过各模态数据线性投影矩阵增加结构约束，学习不同模态数据集的特征，选出判别能力符合判别要求的特征；步骤S5，挖掘不完整观测多模态集中的各模态间和模态内相似性关系，结合子空间学习和特征学习建立优化目标函数；步骤S6，优化所述目标函数得到多模态数据集共享子空间表达以及各模态的线性投影矩阵；步骤S7，根据所述各模态的线性投影矩阵进行跨模态检索。

【技术特征摘要】
1.一种基于子空间学习的不完整跨模态检索方法，其特征在于，包括步骤：步骤S1，收集多模态数据并分别提取各模态的特征；步骤S2，利用提取的各模态的特征构造不完整观测多模态数据集；步骤S3，基于回归方式学习不完整观测多模态数据集共享子空间表达，并分别学习各模态数据线性投影矩阵；步骤S4，通过各模态数据线性投影矩阵增加结构约束，学习不同模态数据集的特征，选出判别能力符合判别要求的特征；步骤S5，挖掘不完整观测多模态集中的各模态间和模态内相似性关系，结合子空间学习和特征学习建立优化目标函数；步骤S6，优化所述目标函数得到多模态数据集共享子空间表达以及各模态的线性投影矩阵；步骤S7，根据所述各模态的线性投影矩阵进行跨模态检索。2.根据权利要求1所述方法，其特征在于，所述不完整观测多模态数据集中有部分数据包含完整的多模态特征表达，其它部分数据包含部分多模态特征。...

【专利技术属性】
技术研发人员：王亮，吴书，尹奇跃，
申请(专利权)人：天津中科智能识别产业技术研究院有限公司，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人