当前位置: 首页 > 专利查询>鲁东大学专利>正文

基于多相似度一致矩阵分解的哈希检索方法技术

技术编号:30830577 阅读:51 留言:0更新日期:2021-11-18 12:43
本发明专利技术公开了基于多相似度一致矩阵分解的哈希检索方法,其通过互联网收集图像和文本数据建立数据集,并将数据集划分为训练集和测试集;利用BOW算法分别提取所有图像和文本模态数据的特征;为了更好地挖掘不同模态之间的语义相关性,设计了一个多相似度一致矩阵,该矩阵既能保持数据之间的绝对相似度,又能保持数据之间的相对相似度;利用多相似度一致矩阵和矩阵分解将图像、文本数据分别映射到一个语义子空间;利用类标签衍生出一个语义子空间,并利用该空间对齐图像和文本模态的语义;通过最小化量化损失生成统一的哈希码;本发明专利技术具有较高的检索性能,容易应用到大规模数据集,因此具有广阔的应用前景。此具有广阔的应用前景。此具有广阔的应用前景。

【技术实现步骤摘要】
基于多相似度一致矩阵分解的哈希检索方法


[0001]本专利技术尤其涉及基于多相似度一致矩阵分解的哈希检索方法,属于多媒体检索的跨模态检索


技术介绍

[0002]随着5G网络的到来,社交网络上产生了大量的多媒体数据,如文字、图片、视频等;面对如此庞大的数据量,如何高效地进行检索是一个越来越受到关注的问题;近年来,最近邻检索引起了人们的广泛关注;它可以从候选数据库中选择与查询数据最匹配的数据;然而,随着互联网上数据的爆炸式增长,在大规模数据集上的最近邻检索通常会导致检索速度慢、存储成本大等问题;为了解决上述问题,有研究者提出了哈希技术,将原始空间中的相似点映射到相似的哈希码中,然后用异或运算快速计算的汉明距离测量数据之间的相似性;由于哈希技术计算效率和存储成本都很高,因此在多媒体检索领域引起了广泛的关注。
[0003]早期哈希技术在单模态检索中得到了广泛应用;随着网络社会的快速发展,互联网上产生了大量的多媒体数据,使得检索工作日益复杂化,变成更有挑战性的任务;因此,跨模态检索成为一个新的研究热点,跨模态检索的主要目标是建立不同的模本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于多相似度一致矩阵分解的哈希检索方法,其特征在于其包括以下步骤:1)步骤S1,通过互联网收集图像和文本两个模态的数据,并建立图像和文本两个模态的数据集,并将两个模态的数据集划分为训练集和测试集;2)步骤S2,分别利用图像和文本的BOW算法提取训练集和测试集的图像和文本的特征;3)步骤S3,构造训练集上的基于多相似度一致矩阵分解的哈希检索的总目标函数,其包括以下步骤:步骤S31,用来描述训练集的数据特征,其中,和分别代表两个模态的维度,n为样本对的数量;,其中表示第t个模态;是来自图像和文本两个模态的特征向量;在不丢失一般性的情况下,不同模态的数据均采用零均值化;代表类标签矩阵并且代表第i个标签向量,其中c是全部类别的数量;表示第i个训练数据属于第q个语义类别,反之;表示哈希码,其中,k表示哈希码的长度;步骤S32,用径向基核函数将两个模态的数据特征映射到核空间:征映射到核空间:表示径向基核函数的参数,()表示个从训练集中随机选取的数据作为锚点;步骤S33,用和分别表示图像和文本模态的核化后的数据,先通过矩阵分解学习独立的子空间:其中是一个投影矩阵,是一个独立的子空间,是控制图像模态的权重,是F

范数;步骤S34,类标签首先被映射到一个语义空间,在这个语义空间中,具有相同类标签的数据具有相同的表示;然后通过语义空间将跨模态语义信息对齐,其目标函数可定义为:其中Z是一个将类标签映射到语义空间的投影矩阵, 是权重系数;步骤S35,为每个模态学习一个线性映射矩阵,其目标函数定义为:
其中是线性投影正则项的权重系数;设计一个多相似度一致矩阵,该矩阵既能保持数据之间的绝对相似度,又能保持数据之间的相对相似度;对,和归一化为,和后,通过以下方式计算每个模态和类别标签的相似矩阵:,和;然后,通过加权求和的方式将它们合并,得到绝对相似矩阵,如下所示:;将相对相似度定义如下:;其中是描述文本和标签之间高阶邻域信息重要性的折衷参数,是描述图片和标签之间高阶邻域信息重要性的折衷参数;步骤S36,根据绝对相似度和相对相似度的定义,将多相似度一致矩阵表示为:;上述公式不仅将类标签嵌...

【专利技术属性】
技术研发人员:姚涛李艺茹王洪刚张小峰刘莉
申请(专利权)人:鲁东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1