一种基于可变长深度哈希学习的图像检索方法技术

技术编号：14572432 阅读：233 留言：0更新日期：2017-02-06 09:22

本发明专利技术公开一种基于可变长度深度哈希学习的图像检索方法，主要涉及图像检索与深度学习领域。该方法将哈希码的学习建模成相似性学习的过程。具体来说，该方法利用训练图像产生一批三元图像组，其中每个三元组包含两张具有相同类标的图像与一张具有不同类标的图像。对模型训练的目的是最大化匹配的图像对与不匹配的图像对在海明空间的间隔。本方法的学习部分引入了深度卷积神经网络，通过对图像特征与哈希函数的联合优化，实现了端到端的训练过程。另一方面，卷积网络输出的哈希码每一位都具有不同的权重。针对不同的检索任务，用户可以通过截断不重要的比特位来实现哈希码长度的调控。同时，该方法能够在哈希码较短的情况下的有效地保持其判别性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像检索领域与深度学习领域，更具体的，涉及一种基于可变长深度哈希学习的图像检索方法。
技术介绍
随着互联网飞速发展，以图像和视频为载体的多媒信息的数量也呈现爆炸性增长。如何才能从海量的数据中获取自己想要信息，成为工业界和学术界广泛讨论的内容。哈希技术凭借在存储空间和计算效率两个方面的巨大优势，受到了广泛的关注与研究。随着研究的不断深入，基于图像内容的哈希学习侧重将图像转化成为二进制编码后仍然能够有效保持其与其他图像的语义相关性。为了解决以上问题，多篇基于机器学习的哈希学习算法被提出。其中，一类基于有监督的图像哈希学习算法表现出了更为良好的效果，有着更加巨大的潜力。一般来说，有监督框架下的图像哈希学习有两个主要部分构成，首先，图像将被手工设计的特征描述子表达成特征向量的形式，这一步的目的是为了在图像存在噪声或者其他冗余信息的情况下提取出图像的语义信息；其次是将哈希的学习过程表达成一个图像之间距离的优化问题，以此在学习到的海明空间中保持图像的语义一致性。但是大多数的学习方法将以上两个过程拆分开进行处理，这样就使得图像的特征表达无法在特征的学习过程中进行优化。同时，通过手工设计图像的特征需要大量的领域知识，很难有效适应不同的应用任务。近几年，一种名为多层自动编码器的模型被提出，该模型可以直接从原图像中得到图像特征并进一步转化为二进制编码。但由于其复杂的优化过程使得其在实际应用中受到很大限制...

【技术保护点】
一种基于可变长深度哈希学习的图像检索方法，其特征在于，包括：S1.将训练图像集合划分成一批三元图像组；S2.将三元图像组输入到深度卷积神经网络中；S3.计算每张图像产生的损失，并通过反向传播算法来训练深度卷积神经网络；S4.根据用户的输入，截断不重要的哈希比特位，并且计算查询图像与数据库每张图像之间的带权重海明距离；S5.根据步骤S4中的带权重的海明距离，从小到大对数据库图像进行排序，排序结果即为返回的相似性检索结果。

【技术特征摘要】
1.一种基于可变长深度哈希学习的图像检索方法，其特征在于，包括：
S1.将训练图像集合划分成一批三元图像组；
S2.将三元图像组输入到深度卷积神经网络中；
S3.计算每张图像产生的损失，并通过反向传播算法来训练深度卷积神经网
络；
S4.根据用户的输入，截断不重要的哈希比特位，并且计算查询图像与数据
库每张图像之间的带权重海明距离；
S5.根据步骤S4中的带权重的海明距离，从小到大对数据库图像进行排序，
排序结果即为返回的相似性检索结果。
2.根据权利要求1所述的基于可变长深度哈希学习的图像检索方法，其特
征在于，所述步骤S1中所述的三元图像组具体包括两张具有相同类别标签的图
像与一张具有不同类别标签的图像。
3.根据权利要求1所述的基于可变长深度哈希学习的图像检索方法，其特
征在于，所述步骤S2中的深度卷积神经网络包含若干卷积层和池化层，部分全
连接层，一个类双曲正切函数层以及一个哈希权重层；
所述的类...

【专利技术属性】
技术研发人员：林倞，张瑞茂，王青，江波，
申请(专利权)人：中山大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人