The invention discloses a large-scale image retrieval algorithm based on binary features. The method comprises the following steps: (1) initializing neural network parameters and initializing real-value output features according to the training picture set; (2) constructing picture similarity matrix according to the training picture set, and constructing Laplace matrix; The loss function is constructed by weighted similarity measure; the loss function is used to derive the real value output feature, and the difference is fixed to update the real value output feature, while the network parameters are updated; the loss function is used to derive the difference, and the difference is fixed to update the real value output feature; the loss function is used to update the difference; the loss function is used to derive the difference, and the difference is fixed to update the real value output feature. Open weights are used to update the real value output features and network parameters according to M and M 4 and combined with loss function until the end of training. This method can effectively compensate for the imbalance between positive and negative training samples in the input data set and effectively improve the retrieval accuracy.
【技术实现步骤摘要】
基于二值特征的大规模图像检索算法
本专利技术涉及计算机视觉、多媒体
,特别涉及一种基于二值特征的大规模图像检索算法。
技术介绍
图像检索是一种用来寻找图片的数据搜索方法。系统根据用户输入的关键字、图片等检索信息,从数据库中寻找一些与输入相似的图片并反馈给用户。相似度的衡量可以基于图片辅助信息(如关键字)或者图片纹理、颜色、形状等图片内容特征。基于内容的图像检索是计算视觉在图像检索领域的应用。此类算法旨在避免使用文本信息检索图像,而是通过图片自身的纹理、颜色、形状等特征来进行检索。这类算法需要计算检索图像和数据库图像在特征空间中的欧氏距离。在大规模数据集中,使用实值特征的存储开销和检索时计算欧氏距离的时间开销都是难以接受的。基于哈希的图像检索可以解决上述时间、存储开销过大的问题。基于哈希的图像检索算法使用二值特征而非实值特征存储和检索图像。二值特征之间的距离计算可以利用异或操作快速实现,同时由于二值特征中的每一位只需要1比特的存储空间,因此可以明显减少数据库图片特征的存储开销。二值特征被称为哈希特征,从原始空间映射到汉明空间的函数称为哈希函数,学习得到哈希特征的过程被称作哈希学习。哈希学习中最大的难点在于求解最优哈希特征的优化问题是NP难问题。这是由哈希特征的值只能取0,1或者±1的属性决定的。这个整数优化问题无法通过传统的数值优化方法求解最优解,因此需要对约束条件进行放松。放松方法主要有三类:直接丢弃二值约束,引入量化误差优化项,将阶跃函数放松为sigmoid函数。第一种方法由于直接忽略的了约束条件,因此学到的哈希函数必然存在巨大的量化误差。第二种方 ...
【技术保护点】
1.一种基于二值特征的大规模图像检索算法,其特征在于,包括以下步骤:步骤S1:初始化神经网络参数,并根据训练图片集初始化实值输出特征;步骤S2:根据所述训练图片集构建图片相似度矩阵,并构建拉普拉斯矩阵;步骤S3:通过加权相似度度量构建损失函数;步骤S4:通过所述损失函数对实值输出特征求导,固定差异量更新所述实值输出特征,同时更新网络参数;步骤S5:通过所述损失函数对差异量求导,固定所述实值输出特征更新所述差异量;以及步骤S6:增大高阶展开权重,并依照所述步骤S3与所述步骤S4且结合所述损失函数持续更新所述实值输出特征与所述网络参数,直到训练结束。
【技术特征摘要】
1.一种基于二值特征的大规模图像检索算法,其特征在于,包括以下步骤:步骤S1:初始化神经网络参数,并根据训练图片集初始化实值输出特征;步骤S2:根据所述训练图片集构建图片相似度矩阵,并构建拉普拉斯矩阵;步骤S3:通过加权相似度度量构建损失函数;步骤S4:通过所述损失函数对实值输出特征求导,固定差异量更新所述实值输出特征,同时更新网络参数;步骤S5:通过所述损失函数对差异量求导,固定所述实值输出特征更新所述差异量;以及步骤S6:增大高阶展开权重,并依照所述步骤S3与所述步骤S4且结合所述损失函数持续更新所述实值输出特征与所述网络参数,直到训练结束。2.根据权利要求1所述的基于二值特征的大规模图像检索算法,其特征在于,所述步骤S1进一步包括:步骤S101:初始化神经网络参数;步骤S102:使用所述初始化的神经网络获取训练图片集中图片的实值输出特征,并将所述实值输出特征作为所述初始实值输出特征H与离散输出特征B=sgn(H),并以所述离散输出特征B作为图片哈希码。3.根据权利要求1所述的基于二值特征的大规模图像检索算法,其特征在于,所述步骤S2包括以下步骤:步骤S201:通过二值相似度函数,计算所述训练图片集中任意两个图片的相似度,记第i个图片和第j个图片的相似度为sij,其构成的图片相似度矩阵记为S;步骤S202:求取所述图片相似度矩阵S的拉普拉斯矩阵,记为Lsym。4.根据权利要求3所述的基于二值特征的大规模图像检索算法,其特征在于,所述步骤S202具体为:计算D=diag(d1,d2,......,dN),L=D-S;所述图片相似度矩阵S的拉普拉斯矩阵5.根据权利要求2或3所述的基于二值特征的大规模图像检索算法,其特征在于,所述步骤S3包括以下步骤:步骤S301:使用加权相似度度量方法补偿正负训练样本的不平衡,通过所述相似度计算所述训练图片集中任意两个图片的加权相似度,记第i个图片和第j个图片的加权相似度为其构成的加权相似度矩阵记为步骤S302:对于所述训练图片集任意图片i与j,根据所述离散输出特征bi与bj,构建损失函数:步骤S303:对所述训练图片集中所有样本对求和,构建...
【专利技术属性】
技术研发人员:鲁继文,周杰,陈志祥,袁鑫,
申请(专利权)人:清华大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。