一种有鉴别的全相似性保留哈希跨模态检索方法技术

技术编号：21141125 阅读：43 留言：0更新日期：2019-05-18 05:10

本发明专利技术公开了一种有鉴别的全相似性保留哈希跨模态检索方法，包括：由图像文本对组成样本构成数据集，并将数据集按照分成特征向量训练集和测试集后做规整和均一化处理；提取双模态数据，构造有鉴别的全相似性保留哈希的目标函数；迭代法求解目标函数，比较求解值与设定阈值的大小；使用预设公式计算哈希码；利用图像特征投影矩阵和文本特征投影矩阵对训练集进行投影变换，获得图像文本语义特征矩阵，再次计算哈希码；计算测试集中每个图像哈希码与训练集中所有文本哈希码之间的汉明距离

全部详细技术资料下载

【技术实现步骤摘要】
一种有鉴别的全相似性保留哈希跨模态检索方法
本专利技术属于模式识别
，涉及考虑保持模态间及模态内数据相似性的同时，保持数据特征向量间的鉴别力度，具体为一种有鉴别的全相似性保留哈希跨模态检索方法。
技术介绍
近几十年来，互联网多媒体数据的爆炸性增长，使得跨媒体数据检索需求增长，并且促进了复杂多模态检索技术的发展。处于现在这个信息的时代，多媒体数据往往来自不同的互联网多媒体平台以及不同的数据资源。这些数据经常共同出现且被用来描述同一物体和事件，因此跨模态检索在实际应用中已经成为必要。为了消除不同模态特征之间的多样性，现有很多研究把关注点放在对潜在子空间的学习上，具体研究的关键点是如何通过学习得到一个共同的语义子空间，能够使得不同模态之间的异构性得到消除，从而使得这些特征在这个学习得到的子空间中能被直接相互匹配；但是这些研究由于忽视了特征维度的可伸缩性，在解决大规模数据的多模态检索时这些方法受到了限制；即传统的跨模态检索方法大都只考虑保留模态内数据的相似性，而忽略了模态间数据相似性的保留，并且在保留相似性的同时破坏了数据之间本身的鉴别力。
技术实现思路
本专利技术的主要目的在于针对现有技术中对跨模检索无法保留模态间数据相似性以及会破坏模态间数据之间本身鉴别力的问题，提供一种有鉴别的全相似性保留哈希跨模态检索方法，本专利技术假设有两种模态的训练数据V＝{v1,...,vn}和T＝{t1,...,tn}，它们分别是同一对象的两种表示模态，这里的n指代训练样本的个数，具体技术方案如下：一种有鉴别的全相似性保留哈希跨模态检索方法，所述方法包括步骤：S1、由图像文本对组...

【技术保护点】
1.一种有鉴别的全相似性保留哈希跨模态检索方法，其特征在于，所述方法包括步骤：S1、由图像文本对组成样本构成数据集，并将所述数据集按照设定比例划分成特征向量训练集和测试集，并对每一样本中对应文本和图像的特征向量做数据规整和均一化处理；S2、提取所述训练集中具有双模态的数据，基于所述数据构造有鉴别的全相似性保留哈希的目标函数：

【技术特征摘要】
1.一种有鉴别的全相似性保留哈希跨模态检索方法，其特征在于，所述方法包括步骤：S1、由图像文本对组成样本构成数据集，并将所述数据集按照设定比例划分成特征向量训练集和测试集，并对每一样本中对应文本和图像的特征向量做数据规整和均一化处理；S2、提取所述训练集中具有双模态的数据，基于所述数据构造有鉴别的全相似性保留哈希的目标函数：，其中，T为文本特征矩阵，PT为文本特征矩阵对应的文本特征投影矩阵，V为图像特征矩阵，PV为图像特征矩阵对应的图像特征投影矩阵，Y为标签矩阵，W为线性分类器，S为语义特征矩阵，L为保留相似性的图拉普拉斯矩阵，γ，μT，μV，λ均为折衷参数；S3、设定一阈值，采用迭代法求解所述目标函数，判断每一迭代过程中所述目标函数的解，若所述解小于或等于所述阈值，则停止迭代，并更新PV，PT，S和W；S4、基于所述目标函数的迭代解采用公式H＝sign(S)计算训练集哈希码；S5、利用所述更新得到的PV和PT对所述训练集进行投影变换，将投影变换后得到的矩阵作为图像文本语义特征矩阵，使用公式H＝sign(S)计算测试集哈希码；S6、计算所述测试集中每个图像哈希码与所述训练集中所有文本哈希码之间的汉明距离以及所述测试集每个文本哈希码与所述训练集中所有图像哈希码之间的汉明距离S7、升序排列和并根据排列结果查询到所述文本和图像在模态中对应的索引，并按照相关度排名后取前r个作为检索结果，并基于所述模态双模态数据的标签信息对r个所述检索结果...

【专利技术属性】
技术研发人员：荆晓远，朱治兰，孙莹，吴飞，董西伟，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人