The invention relates to the field of retrieval methods, especially the target retrieval method based on convolution neural network and supervised kernel hashing. The retrieval methods include: (1) introducing the convolution neural network to learn the training image, using its special network structure to implicitly learn the high order representation of the image data and generate the deep features. (2) introducing the supervised kernel hash method to enhance the resolution of the linear non separable data, and using the hash code inner product and Han Mingju The target function is proposed in the equivalent relationship, and the feature of high dimension image is supervised and learned by the similarity information of the training image, and Hashima is generated. (3) using the trained hash function to construct the image index, the retrieval of large scale image data is realized. This invention greatly improves the efficiency of target retrieval through the target retrieval method based on the convolution neural network and the supervision of the nuclear hash, and enhances the practicability in the large data environment.
【技术实现步骤摘要】
基于卷积神经网络和监督核哈希的目标检索方法
本专利技术涉及检索方法领域,尤其是基于卷积神经网络和监督核哈希的目标检索方法。
技术介绍
随着大数据时代的到来,互联网视频图像资源迅猛增长,如何对大规模视频、图像资源中的关注目标进行快速有效地检索以满足用户需求亟待解决。虽然局部特征点的出现,如SIFT(Scale-InvariantFeatureTransform)、HOG(HistogramofOrientatedGradients)等在图像处理领域表现出优良的性能,但是生成这些描述子时固定的编码步骤使得描述子缺少学习能力,限制了其图像内容表达能力,难以适应多样的图像数据,在一定程度上降低了大规模图像目标检索性能。为了得到大量图像数据的内在隐含关系,生成更具有区分性和代表性的特征,Hinton等学者将深度学习(DeepLearning)应用于图像处理领域中,为提取更加有效的图像特征提供了新思路。深度置信网络(DeepBeliefNetwork,DBN)顶层采用三阶玻尔兹曼机(BoltzmannMachine,BM),将改进的DBN用于三维目标特征提取,该特征对目标旋转变化具有较高的鲁棒性。此外,研究者构建了卷积深度置信网络(ConvolutionalDeepBeliefNetwork,CDBN),利用CDBN能从未标注的自然图像中学习有效的高阶特征表示。以及通过在卷积神经网络(ConvolutionalNeuralNetwork,CNN)的卷积层和全连接层加入SPP(SpatialPyramidPooling)层,直接对不同大小图像进行学习并生成多尺度特征。但 ...
【技术保护点】
1.一种基于卷积神经网络和监督核哈希的目标检索方法,其特征是,包括以下步骤:(1)引入卷积神经网络对训练图像进行学习,利用其特殊网络结构隐式地学习得到图像数据的高阶表示,生成深层特征;(2)引入增强对线性不可分数据的分辨力的监督核哈希方法,同时利用哈希码内积与汉明距离的等价关系提出目标函数,并结合训练图像的相似性信息对高维图像特征进行监督学习,并生成哈希码;(3)利用已训练好的哈希函数构造图像索引,实现对大规模图像数据的检索。
【技术特征摘要】
1.一种基于卷积神经网络和监督核哈希的目标检索方法,其特征是,包括以下步骤:(1)引入卷积神经网络对训练图像进行学习,利用其特殊网络结构隐式地学习得到图像数据的高阶表示,生成深层特征;(2)引入增强对线性不可分数据的分辨力的监督核哈希方法,同时利用哈希码内积与汉明距离的等价关系提出目标函数,并结合训练图像的相似性信息对高维图像特征进行监督学习,并生成哈希码;(3)利用已训练好的哈希函数构造图像索引,实现对大规模图像数据的检索。2.根据权利要求1所述的基于卷积神经网络和监督核哈希的目标检索方法,其特征在于:所述卷积神经网络的输入图像大小为227×227,输出为4096×1的图像深层特征,一共包含5个卷积层、3个子采样层;在卷积层前一层的特征图与可学习的卷积核Kij进行卷积,卷积的结果经非线性函数f(·)生成这一层的特征图具体形式如下:公式一:为第l个卷积层Cl的输出,代表卷积运算,bj为偏置,卷积核Kij可与前一层的一个或多个特征图确定卷积关系,Mj代表输入特征图集合,常用的非线性函数有f(x)=tanh(x)和f(x)=(1+e-x)-1,卷积层生成的特征图大小hl可由公式二进行计算:公式二:hl-1为第l-1层特征图的大小,zl表示第l层卷积核的大小,λl是卷积核移动步长,ρl表示卷积运算时对前一层特征图边缘补零的列数;各层卷积核大小Z={z1=11,z2=5,z3=z4=z5=3},移动步长Λ={λ1=4,λ2=λ3=λ4=λ5=1},特征图边缘补零列数P={ρ1=0,ρ2=2,ρ3=ρ4=ρ5=1};子采样层采用重叠采样方法对特征图进行最大值采样,采样区域为3×3,采样步长为2个像素;卷积神经网络的训练主要分前向传播和后向传播两个阶段:前向传播阶段:从训练样本中选取一个样本(X,Yp),X从输入层经逐级变换传送到输出层,计算相应的实际输出:公式三:Op=Fn(…(F2(F1(XpW(1))W(2))…)...
【专利技术属性】
技术研发人员:李弼程,赵永威,朱彩英,陈良浩,
申请(专利权)人:江苏测联空间大数据应用研究中心有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。