一种基于卷积神经网络深度特征的分级图像检索方法技术

技术编号：18445093 阅读：55 留言：0更新日期：2018-07-14 10:27

本发明专利技术提供一种基于卷积神经网络深度特征的分级图像检索方法。基本原理是，首先，训练用于特征提取的卷积神经网络，确定网络参数；然后，利用训练好的卷积神经网络提取图像特征，可以得到多个卷积层二进制特征和一个全连接层二进制特征；其次，将多个卷积层二进制特征用于初筛检索阶段，进一步压缩后进行多特征相似度融合，筛选出候选图像集，减小检索范围；最后，利用全连接层二进制特征在候选图像集上进行精确检索，得到最终检索结果。基于公共图像检索数据集的实验结果表明，相比于现有的图像检索方法，本方法采用图像的表征方式更全面，特征压缩方法更简单高效，检索准确率较高，并且分级检索的方式分散系统计算量，有利于并行加速实现，具有实用价值。

A hierarchical image retrieval method based on convolutional neural network depth features

The invention provides a hierarchical image retrieval method based on convolutional neural network depth features. The basic principle is that first, the convolution neural network used for feature extraction is trained to determine the network parameters. Then, using the trained convolution neural network to extract the image features, the binary feature of multiple coiling layers and a fully connected layer binary feature can be obtained. Secondly, the binary feature of multiple coiling layers is used for the initial screening. In the retrieval stage, the multi feature similarity fusion is carried out after further compression, and the candidate image sets are screened to reduce the retrieval range. Finally, the full connection layer binary feature is used to retrieve the candidate image set accurately, and the final retrieval results are obtained. The experimental results based on the common image retrieval data set show that compared with the existing image retrieval methods, the method is more comprehensive, the feature compression method is more simple and efficient, the retrieval accuracy is higher, and the hierarchical retrieval method is used to disperse the computation of the system, which is beneficial to the parallel acceleration implementation and is practical. Value.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于卷积神经网络深度特征的分级图像检索方法
本专利技术属于图像处理技术和信息检索领域，涉及一种利用深度学习中卷积神经网络提取深度特征实现的分级图像检索方法。
技术介绍
在图像数据爆炸增长的当下，对图像数据进行快速有效的检索是管理海量图像数据一种重要的方式，基于内容的图像检索(Content-BasedImageRetrieval,简称CBIR)技术在这样的实际需求下应运而生。CBIR是一种在通过提取图像内容信息来实现匹配的图像检索方式，其目标是：用户给定一幅查询图像，从一个大规模数据库中快速检索到与查询图像内容相关相似的图像，并按照相似度排序返回给用户。传统的CBIR系统通过手动提取图像中的视觉特征，如颜色、纹理、形状、局部特征聚合描述符(VectorofLocallyAggregatedDescriptors，VLAD)等特征，实现图像检索功能。这些人工提取的特征也存在着一些局限性：一方面，对于不同类型的图像，不同特征的有效性不同，在大规模的数据集上应用时泛化能力较差；另一方面，这些特征属于视觉的浅层特征，表征的是图像表面的低级信息，并不能反映图像的内容语义信息，存在与用户理解存在不一致的“语义鸿沟”问题，难以对图像内容准确表达。近些年随着深度学习的兴起，卷积神经网络(ConvolutionalNeuralNetwork，CNN)被证明了在视觉表征方面有着巨大的优势，CNN的深层特征更贴近人们理解层面来解释图像内容，打破了传统方法图像特征表达的局限。现有的CBIR系统利用CNN作为特征提取器，通过提取网络最后的全连接层特征来表征图像，取得了较好的检索...

【技术保护点】
1.一种基于卷积神经网络深度特征的分级图像检索方法，其特征在于，包括下述步骤:第一步：特征提取网络的参数设置：采用卷积神经网络作为特征提取网络，采用迁移学习的方法设置网络参数：(一)将该网络在大数据库上进行分类预训练来确定合适的网络初始参数；(二)在目标图像库上训练微调网络参数，使其在目标数据集上表现最优，完成特征提取网络参数的确定；第二步：提取图像的二进制深度特征：(一)从网络中提取类二进制特征向量：将图像输入训练好的卷积神经网络，分别在最后的卷积模块和全连接模块的修正线性单元Rectified Linear Units(ReLU)层后提取类二进制深层特征；设从第k个ReLU层提取到的类二进制特征图为

【技术特征摘要】
1.一种基于卷积神经网络深度特征的分级图像检索方法，其特征在于，包括下述步骤:第一步：特征提取网络的参数设置：采用卷积神经网络作为特征提取网络，采用迁移学习的方法设置网络参数：(一)将该网络在大数据库上进行分类预训练来确定合适的网络初始参数；(二)在目标图像库上训练微调网络参数，使其在目标数据集上表现最优，完成特征提取网络参数的确定；第二步：提取图像的二进制深度特征：(一)从网络中提取类二进制特征向量：将图像输入训练好的卷积神经网络，分别在最后的卷积模块和全连接模块的修正线性单元RectifiedLinearUnits(ReLU)层后提取类二进制深层特征；设从第k个ReLU层提取到的类二进制特征图为该层有N个特征图，设每个特征图Vik(i＝1,....,N)的大小为m*m；(二)二值化特征向量：通过将所有Vik(i＝1,....,N)特征图中的非零元素置1，将每个Vik(i＝1,....,N)转化为标准二进制特征图得到标准二进制特征图向量提取到卷积模块中的n个卷积二进制特征图向量和一个全连接二进制特征图向量；第三步：初筛检索阶段：将n个卷积二进制特征图向量用于第一级初筛阶段，用k＝1,2,…,n分别表示；(一)特征向量压缩：将各卷积特征向量中的每个特征图进行求和操作：得到压缩后的特征向量：(二)相似度测量：分别用这n种卷积特征向量测量目标图像库中图像与查询图像的相似度，相似度的测量方法是：设查询图像的特征向量和目标图像库中图像的特征向量m为原始特征图的大小；...

【专利技术属性】
技术研发人员：余莉，韩方剑，罗迤文，
申请(专利权)人：湖南省瞬渺通信技术有限公司，
类型：发明
国别省市：湖南,43

全部详细技术资料下载我是这个专利的主人