图像检索方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号：21247091 阅读：30 留言：0更新日期：2019-06-01 07:25

本发明专利技术实施例公开了一种图像检索方法、装置、设备及计算机可读存储介质。其中，方法包括首先利用卷积层数不同的两个卷积神经网络并联构造双列卷积哈希映射模型，第一卷积神经网络与第二卷积神经网络的池化层数目、池化窗口的大小和步长均相同；该模型包含由第一卷积神经网络和第二卷积神经网络的输出并联而成的第一全连接层及作为哈希编码层的第二全连接层。将待检索图像利用双列卷积哈希映射模型映射为待检索哈希编码；在哈希编码库中查找与待检索哈希编码的汉明距离差值满足预设条件的目标图像，以作为待检索图像在图像数据库的检索结果；哈希编码库为将图像数据库中每张图像经双列卷积哈希映射模型映射后所得。本申请提高图像检索的准确率。

Image Retrieval Method, Device, Equipment and Computer Readable Storage Media

The embodiment of the present invention discloses an image retrieval method, device, device and computer readable storage medium. Firstly, two convolution neural networks with different convolution layers are used to construct a double-row convolution hash mapping model in parallel. The number of pooling layers, the size and step-size of the pooling window of the first convolution neural network and the second convolution neural network are the same. The model contains the first full-connection layer which is composed of the output of the first convolution neural network and the second convolution neural network in parallel. And the second full connection layer as the hash coding layer. The image to be retrieved is mapped to the hash coding to be retrieved by using the double-column convolution hash mapping model; the target image which satisfies the presupposed condition of the Hamming distance difference between the image to be retrieved and the hash coding is searched in the hash coding library as the retrieval result of the image database to be retrieved; and the hash coding library is mapped to each image in the image database by the double-column convolution hash mapping model. Income. This application improves the accuracy of image retrieval.

全部详细技术资料下载

【技术实现步骤摘要】
图像检索方法、装置、设备及计算机可读存储介质
本专利技术实施例涉及图像处理
，特别是涉及一种图像检索方法、装置、设备及计算机可读存储介质。
技术介绍
近些年来，随着互联网的进一步普及和大数据技术的深入应用，每天都会有数以亿计的图像产生。图像数据资源的集中和规模的增大使得现有技术越来越难以满足用户图像检索的需求。因此，如何有效地描述图像的特征信息，采用何种数据结构进行高效索引和快速相似性检索等问题成为了这个方向的研究热点。面对大规模的图像数据，鉴于二进制编码具有易于比较与存储的性质，可以极大的提升相似性检索的速度并节省更多的计算机资源，故在进行图像检索时一般将图像映射成二进制编码。深度学习的出现推动了计算机视觉的发展，也为学习哈希映射方法提供了更有效的工具。相关技术用神经网络模型映射哈希编码，然利用图像的方式训练深度学习模型，通过损失函数来约束该模型参数，取得了较为不错的结果。但是，该方法检索图像的准确率不高，尤其是针对比较相似图像，无法满足用户对图像检索精度的高要求。鉴于此，如何提升图像检索的准确率，是本领域技术人员亟待解决的问题。
技术实现思路
本公开实施例提供了一种图像检索方法、装置、设备及计算机可读存储介质，提高图像检索的准确率。为解决上述技术问题，本专利技术实施例提供以下技术方案：本专利技术实施例一方面提供了一种图像检索方法，包括：利用预先构建的双列卷积哈希映射模型将待检索图像映射为待检索哈希编码；在预先构建的哈希编码库中查找与所述待检索哈希编码的汉明距离差值满足预设条件的目标图像，以作为所述待检索图像在图像数据库的检索结果；其中，所述双列卷积哈...

【技术保护点】
1.一种图像检索方法，其特征在于，包括：利用预先构建的双列卷积哈希映射模型将待检索图像映射为待检索哈希编码；在预先构建的哈希编码库中查找与所述待检索哈希编码的汉明距离差值满足预设条件的目标图像，以作为所述待检索图像在图像数据库的检索结果；其中，所述双列卷积哈希映射模型为由卷积层数不同的两个卷积神经网络组合而成，包含由第一卷积神经网络和第二卷积神经网络的输出并联而成的第一全连接层及作为哈希编码层的第二全连接层；所述第一卷积神经网络与所述第二卷积神经网络的池化层数目、池化窗口的大小和步长均相同；所述哈希编码库为将所述图像数据库中每张图像经所述双列卷积哈希映射模型映射后所得。

【技术特征摘要】
1.一种图像检索方法，其特征在于，包括：利用预先构建的双列卷积哈希映射模型将待检索图像映射为待检索哈希编码；在预先构建的哈希编码库中查找与所述待检索哈希编码的汉明距离差值满足预设条件的目标图像，以作为所述待检索图像在图像数据库的检索结果；其中，所述双列卷积哈希映射模型为由卷积层数不同的两个卷积神经网络组合而成，包含由第一卷积神经网络和第二卷积神经网络的输出并联而成的第一全连接层及作为哈希编码层的第二全连接层；所述第一卷积神经网络与所述第二卷积神经网络的池化层数目、池化窗口的大小和步长均相同；所述哈希编码库为将所述图像数据库中每张图像经所述双列卷积哈希映射模型映射后所得。2.根据权利要求1所述的图像检索方法，其特征在于，所述双列卷积哈希映射模型的训练过程包括：以所述图像数据库中的图像对为输入；若所述图像对的标签类别为相似，则以所述图像对映射得到的哈希编码对之间的距离为损失值；若所述图像对的标签类别为不相似，则以所述图像对映射得到的哈希编码对之间的距离和间隔为损失值；所述标签类别用于标识所述图像对中两张图像的相似性；采用机器学习优化算法优化所述损失值以训练所述双列卷积哈希映射模型。3.根据权利要求2所述的图像检索方法，其特征在于，所述双列卷积哈希映射模型的损失值为：式中，Loss为所述损失值，第i张图像与第j张图像组成所述图像对，n为所述图像数据库中图像总个数，oi为第i张图像的哈希编码，oj为第j张图像的哈希编码，||oi-oj||2为的哈希编码对间的距离，m为所述图像对映射得到的哈希编码对的间隔，α为超参数，yi,j为标签类别，yi,j＝1表示第i张图像与第j张图像为相似，yi,j＝0表示第i张图像与第j张图像不相似。4.根据权利要求2所述的图像检索方法，其特征在于，采用机器学习优化算法优化所述损失值以训练所述双列卷积哈希映射模型为采用随机梯度下降优化所述损失值以训练所述双列卷积哈希映射模型。5.根据权利要求1至4任意一项所述的图像检索方法，其特征在于，所述哈希编码库的生成过程为：将所述图像数据库中的每张图...

【专利技术属性】
技术研发人员：张莉，陆鋆，王邦军，周伟达，
申请(专利权)人：苏州大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人