一种基于深度卷积神经网络和局部敏感哈希算法相结合的图像检索方法技术

技术编号：39060771 阅读：14 留言：0更新日期：2023-10-12 19:53

本发明专利技术涉及图像检索(ImageRetrieval)技术领域，尤其为通过设计一种基于深度卷积神经网络和局部敏感哈希算法相结合的图像检索方法，其步骤具体如下：步骤S1：图像检索的开源数据集中训练集和验证集；步骤S2：训练时，模型的输入；步骤S3：测试检索排名；步骤S4：图像检索的损失函数采用对比损失函数，模型评价指标除了mAP以外，还新增mP@k，本方法通过设计一种基于深度卷积神经网络和局部敏感哈希算法相结合的图像检索方法，该算法利用深度卷积的方式提取获取gallery库和query库的图像特征，进行LSH哈希编码，大大提升了检索性能，使用孪生网络中的对比学习，大大提升了检索精度。大大提升了检索精度。大大提升了检索精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度卷积神经网络和局部敏感哈希算法相结合的图像检索方法

[0001]本专利技术涉及图像检索(Image Retrieval)
，具体为一种基于深度卷积神经网络和局部敏感哈希算法相结合的图像检索方法。

技术介绍

[0002]以图搜图，或称图像检索，是一种通过输入一张图像(多张可存放在query库)，在图像库(也称gallery库)，通常利用计算机视觉等技术，对输入图像进行特征提取，并与图像库中进行特征匹配，快速准确在图像库中查询到与之类似或相同图像的过程。目前，已有的真正能运用的基于图像内容的检索
主要有2种：一种是基于图像特征(如颜色、纹理等)来区分不同的图像，将图像转换为颜色直方图等方式，利用相似性度量方法(如欧氏距离、余弦相似度等)方式计算图像之间的相似度。这种方法简单易实现，但对于复杂的图像来说，可能无法捕捉到图像的更高级别的语义特征，因此检索效果有限。另一种，基于深度学习的检索技术：利用卷积神经网络(CNN)等深度学习模型进行特征提取和匹配。这种方法可以有效地提取高级别的语义特征，并且在大规模数据集上进行端到端的训练，从而获得更好的性能。但需要大量的数据和计算资源，且对于小规模的数据集效果不佳。前者提取特征有限，只能运用到简单的图像比对，不适合实际场景应用，后者依赖大量的数据支持，精度无法保证。
[0003]综上所述，本专利技术通过设计一种基于深度卷积神经网络和局部敏感哈希算法相结合的图像检索方法来解决存在的速度和精度无法同时保证的问题。

技术实现思路

[0004]...

【技术保护点】

【技术特征摘要】
1.一种基于深度卷积神经网络和局部敏感哈希算法相结合的图像检索方法，其步骤具体如下：步骤S1：图像检索的开源数据集中训练集和验证集采用的是retrieval
‑
SfM
‑
120k，测试集则采用Oxford5k、Paris6k、ROxford5k、RParis6k，如需在自己的数据集上进行训练，需要将数据格式准备为与上述数据集一致，对数据进行预处理后，图片输入大小1024*1024*3，使用深度卷积神经网络ResNe t101提取RGB图像特征,涉及到gallery库和query库的图像均需提取特征，为了后续检索比对，从gallery库和query库提取特征的区别是是否返回LSH编码，通过局部敏感哈希算法LSH对每张图片特征图进行0，1二进制编码，旨在加快查询图像与图像搜索库的匹配速度；步骤S2：训练时，模型的输入：训练集中的图片通过模型变成特征向量，从中选取QSIZE，即Q
‑
P对的个数个元组，每个元组共有，即1+1+NNUM个特征向量，分别是查询对象Q，正类P和NNUM个负类N1,N2....查询和正类是由Q
‑
P对直接给出；负类是Q由当前模型的在图片池中的查询结果，按照查询顺序从上到下依次选取NNUM个与q在不同簇的图片，且这NNUM个图片也在不同的簇中；模型的输出：每个元组经过模型的向量特征组成的矩阵；测试时，模型的输入：测试集中图库的图片和查询对象的图片，测试模型的输出：查询对象的特征矩阵，即所有查询对象的特征向量组成的矩阵和图库图片特征矩阵，即图库图片所有的特征向量组成的矩阵；步骤S3：测试检索排名：图库图片特征矩阵与查询对象特征矩阵的点乘，得到的是scores矩阵，即维度：图库图片数量*查询数量，其中第i行，第j列表示图片池中的第i个图片与第j个查询对象的相似度得分；ranks是scores的按列排序的索引值，即得分高的图片的索引排在前面，是最终的检索结果；步骤S4：图像检索的损失函数采用对比损失函数，模型评价指标除了mAP以外，还新增mP@k，是结果列表中top
‑
k检索结果的准确率指标，反映了图像搜索引擎的质量；匹配的图片排的越前面得分会越高，不匹配的图片越排在匹配的后面得分会越高。2.根据权利要求1所述的一种基于深度卷积神经网络和局部敏感哈希算法相结合的图像检索方法，其特征在于，所述S1中的RGB图像维度是W*H*3，H和W分别的特征图的高和宽，3为通道数。3.根据权利要求1所述的一基于深度卷积神经网络和局部敏感哈希算法相结合的图像检索技术，其特征在于，所述S2中图像输入为1024*1024*3，图像经过卷积层，也即卷积神经网络，如ResNet101去掉最后一层，即全连接层，再经过GeM池化层和L2归一化操作，即向量单位化，最终形成一个图像的固定维度的向量表示,即高维特征，涉及到gallery库和query库的图像均需提取特征，为了后续检索比对，从gallery库和query库提取特征的区别是是否返回LSH编码，通过局部敏感哈希算法LSH对每张图片特征图进行0，1二进制编...

【专利技术属性】
技术研发人员：张正卿，胡超，赖盛鑫，邬伟杰，黄家耀，朱力强，
申请(专利权)人：联通上海产业互联网有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人