当前位置: 首页 > 专利查询>鲁东大学专利>正文

基于鲁棒矩阵分解的离散哈希检索方法技术

技术编号:30105110 阅读:39 留言:0更新日期:2021-09-18 09:12
本发明专利技术公开了基于鲁棒矩阵分解的离散哈希检索方法,其通过互联网收集图像和文本两个模态的样本建立数据集;利用BOW算法提取图像和文本两个模态的样本的特征;利用矩阵分解算法学习图像和文本两个模态间的一致性和不一致性,其一致性由共享哈希码来表示,其不一致性由最小化共性来约束;所学习的哈希码可以捕捉不同模态的一致性信息,从而提高检索性能。本发明专利技术具有较高的检索性能,并容易应用到大规模数据集,具有广阔的应用前景。具有广阔的应用前景。具有广阔的应用前景。

【技术实现步骤摘要】
基于鲁棒矩阵分解的离散哈希检索方法


[0001]本专利技术涉及基于鲁棒矩阵分解的离散哈希检索方法,属于多媒体检索的跨模态检索


技术介绍

[0002]随着计算机技术和社交网络的蓬勃发展,近年来多媒体数据量迅速增加,包括文本、图像和视频。对大规模数据集进行快速相似性检索已成为基本要求之一。哈希技术由于其在大规模应用中的高效性,近年来受到了广泛的关注。哈希技术的关键是通过保留数据结构或语义相似性来寻求高维数据点的紧凑二进制表示。随后,在学习到的海明空间中,通过异或运算可以有效地完成检索任务,这使得哈希技术可以应用于大规模数据集。然而,大多数检索任务仅限于在单模态内检索数据点,其中检索数据的类型与查询相同。由于不同模态之间存在异质性差异,这些方法不能直接应用于待检索数据属于不同类型的情况。
[0003]通常,互联网上生成的数据由不同模态表示,例如文本、图像和视频。对于搜索引擎而言,在实际应用中,需要向用户提供各种模态样本作为搜索结果。因此,跨媒体哈希检索技术成为一个研究的热点。跨媒体哈希检索技术将异构样本编码为哈希码,由于其在计算效率本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于鲁棒矩阵分解的离散哈希检索方法,其特征在于,包括如下步骤:步骤S1,通过互联网收集图像和文本两个模态的样本建立数据集,并将数据集划分为训练集和测试集;步骤S2,分别利用图像和文本的BOW算法提取训练集和测试集的图像和文本的特征;步骤S3,利用矩阵分解算法学习图像和文本的特征间的一致性和不一致性,其一致性由共享哈希码来表示,其不一致性由最小化共性来约束,并构造总目标函数;其包括如下步骤:步骤S31,用来表示训练集样本的特征,其中n为样本对的数量, ; 和分别表示来自图像和文本模态的数据的零中心特征向量;利用径向基核函数将图像和文本的特征映射到d维的特征空间,其中和分别表示图像和文本的特征的映射后的特征;步骤S32,将图像和文本模态间的一致性和不一致性融合到一个基于矩阵分解的模型中,其基于矩阵分解的目标函数定义如下:其中, 为平衡图像和文本权值的平衡参数,为平衡一致性和不一致性的平衡参数,和分别表示图像和文本模态的潜在因子矩阵,和分别表示图像和文本模态间不一致部分,B表示模态间一致的部分,即图像和文本样本的哈希码,为不一致性的约束条件,不一致性是样本中存在的噪声或不同模态的特性, 所有元素的和应尽量小,其中表示矩阵的点乘运算,定义如下:其中表示矩阵的点乘运算,使用矩阵形式,上述公式可以进一步写成:其中表示矩阵的迹;步骤S33,由图像和文本模态的哈希码B学习图像和文本模态的哈希函数的目标函数定义为:其中是平衡两个模态哈希函数的参数,和分别表示图像和文本模态的投影矩
阵;步骤S34,因此本发明方法的总目标函数为:其中是平衡正则项权重的参数,表示正则项;步骤S4,求解步骤S3所述的总目标函数,得到图像和文本样本对的哈希码B,以及图像和文本模态的投影矩阵;此目标函数是非凸的,因此本发明提出一种迭代优化算法得到问题的局部最优解,其包括以下子步骤:步骤S41:固定,求解:;是k维单位矩阵;步骤S42:固定,...

【专利技术属性】
技术研发人员:姚涛李艺茹王丽丽张淑宁王洪刚
申请(专利权)人:鲁东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1