面向图像检索的深度强化去冗余哈希算法制造技术

技术编号：22000233 阅读：22 留言：0更新日期：2019-08-31 05:24

本发明专利技术属于图像检索技术领域，具体为面向图像检索的深度强化去冗余哈希算法。本发明专利技术算法包括：分块哈希码推理，利用图像的标签信息构筑相似性矩阵，然后依照该相似性矩阵推理每幅图像的最优哈希码，其中相似性矩阵较为巨大，采用分块方式进行求解；图像‑哈希码映射，将图像的原始像素信息映射到已推理出的最优哈希码上，这一映射过程利用多分类来实现；哈希码冗余位去除，去除已产生的哈希码中对检索精度没有帮助甚至有害的哈希位，这一过程通过深度强化学习训练一个代理，由该代理来寻找一个最优掩码，从而利用此掩码便可去除冗余的哈希位。本发明专利技术训练速度更快，计算开销和存储开销省，检索精度高。

Deep Enhanced Redundant Hashing for Image Retrieval

全部详细技术资料下载

【技术实现步骤摘要】
面向图像检索的深度强化去冗余哈希算法
本专利技术属于图像检索
，具体涉及面向图像检索的深度强化去冗余哈希算法。
技术介绍
随着社交媒体的迅速发展，每天都有大量的多媒体数据产生，包括文本、图像、视频等。为了能够高效地对这些非结构化的数据进行检索，有许多方法曾被提出。最近，近似最近邻检索由于其较高的检索精度、以及较低的计算开销得到越来越多的关注。在各种近似最近邻检索方法中，哈希算法是目前最具潜力的一种方法，其可为高维数据生成紧凑的二进制哈希码，并利用这些哈希码在海明空间中进行检索。本专利技术所关注的是基于学习的哈希算法，其是一种数据相关的算法。与数据无关的算法相比，其能利用监督信息生成更高质量的哈希码，从而在加速检索速度的同时得到更高的检索精度。十几年来，有许多哈希算法被提出过。最近，由于深度学习的巨大成功，深度哈希算法正得到越来越多研究者的关注。深度神经网络极强的拟合能力使得其能拟合任何非线性的哈希函数，另外深度哈希算法也能够以一种端到端的方式来同时完成特征学习和哈希码学习两项任务。在许多公开大规模数据集上，深度哈希算法都能以更简短的哈希码达到更好的检索水平。比如，RobustDiscreteCodeModelingforSupervisedHashing一文提出一种新颖的哈希算法，其能利用离散优化来学习到一组最优的哈希码，从而回避量化误差问题，同时还能处理带有噪声的哈希码和语义标签。虽然许多哈希算法都能提供较好的检索精度和较高的检索性能。然而目前主流的哈希算法都存在两个主要缺陷。首先，由于计算资源的限制，大多数哈希算法只能以小批量(mini-batc...

【技术保护点】
1.一种面向图像检索的深度强化去冗余哈希算法，其特征在于，具体步骤为：步骤1、分块哈希码推理，先利用图像的标签信息构筑相似性矩阵S，然后依照该相似性矩阵来推理每幅图像的最优哈希码；其中相似性矩阵较为巨大，采用分块方式进行求解；步骤2、图像‑哈希码映射，将图像的原始像素信息映射至已推理出的最优哈希码上，这一映射过程利用多分类来实现；步骤3、哈希码冗余位去除，去除已产生的哈希码中对检索精度没有帮助甚至有害的哈希位；这一过程是通过深度强化学习训练一个代理，由该代理来寻找一个最优掩码，利用此掩码去除冗余哈希位。

【技术特征摘要】
1.一种面向图像检索的深度强化去冗余哈希算法，其特征在于，具体步骤为：步骤1、分块哈希码推理，先利用图像的标签信息构筑相似性矩阵S，然后依照该相似性矩阵来推理每幅图像的最优哈希码；其中相似性矩阵较为巨大，采用分块方式进行求解；步骤2、图像-哈希码映射，将图像的原始像素信息映射至已推理出的最优哈希码上，这一映射过程利用多分类来实现；步骤3、哈希码冗余位去除，去除已产生的哈希码中对检索精度没有帮助甚至有害的哈希位；这一过程是通过深度强化学习训练一个代理，由该代理来寻找一个最优掩码，利用此掩码去除冗余哈希位。2.根据权利要求1所述的面向图像检索的深度强化去冗余哈希算法，其特征在于，步骤1所述分块哈希码推理，具体过程为：首先，利用图像标签信息构建相似性矩阵：S＝min(YYT,1)×2-1(1)其中，是每一幅图像的标签，每个标签包含m个语义类别；然后，试用哈希码来重建这一相似性矩阵，并尽可能使重建的相似性矩阵靠近原始的相似性矩阵：其中，是每一幅图像的哈希码，k是哈希码的长度，共计k位，S是上述相似性矩阵；相似性矩阵S非常巨大，需要分块进行计算：假设每次选择计算一个高为h、宽为w的一个分块，则整体的损失函数为：其中，r与c是分块左上角元素的坐标，是连续化之后的哈希码，是矩阵中的第r行至第r+h-1行，其他同理进行。3.根据权利要求2所述的面向图像检索的深度强化去冗余哈希算法，其特征在于，步骤2所述图像-哈希码映射的具体流程为：利用深度卷积神经网络对图像提取特征，并将图像映射至前一阶段推理所得的哈希码上；这里，使用两种不同的CNN来进行映射，一种是8层的AlexNet，另一种是...

【专利技术属性】
技术研发人员：张玥杰，杨觉旭，张涛，
申请(专利权)人：复旦大学，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人