当前位置: 首页 > 专利查询>清华大学专利>正文

基于二值特征的大规模图像检索算法制造技术

技术编号:18668263 阅读:25 留言:0更新日期:2018-08-14 20:38
本发明专利技术公开了一种基于二值特征的大规模图像检索算法,方法包括以下步骤:步骤S1:初始化神经网络参数,并根据训练图片集初始化实值输出特征;步骤S2:根据训练图片集构建图片相似度矩阵,并构建拉普拉斯矩阵;步骤S3:通过加权相似度度量构建损失函数;步骤S4:通过损失函数对实值输出特征求导,固定差异量更新实值输出特征,同时更新网络参数;步骤S5:通过损失函数对差异量求导,固定实值输出特征更新差异量;步骤S6:增大高阶展开权重,并依照步骤S3与步骤S4且结合损失函数持续更新实值输出特征与网络参数,直到训练结束。该方法可以有效补偿输入数据对中的正负训练样本不平衡带来的问题,有效提高检索精度。

Large scale image retrieval algorithm based on two valued features

The invention discloses a large-scale image retrieval algorithm based on binary features. The method comprises the following steps: (1) initializing neural network parameters and initializing real-value output features according to the training picture set; (2) constructing picture similarity matrix according to the training picture set, and constructing Laplace matrix; The loss function is constructed by weighted similarity measure; the loss function is used to derive the real value output feature, and the difference is fixed to update the real value output feature, while the network parameters are updated; the loss function is used to derive the difference, and the difference is fixed to update the real value output feature; the loss function is used to update the difference; the loss function is used to derive the difference, and the difference is fixed to update the real value output feature. Open weights are used to update the real value output features and network parameters according to M and M 4 and combined with loss function until the end of training. This method can effectively compensate for the imbalance between positive and negative training samples in the input data set and effectively improve the retrieval accuracy.

【技术实现步骤摘要】
基于二值特征的大规模图像检索算法
本专利技术涉及计算机视觉、多媒体
,特别涉及一种基于二值特征的大规模图像检索算法。
技术介绍
图像检索是一种用来寻找图片的数据搜索方法。系统根据用户输入的关键字、图片等检索信息,从数据库中寻找一些与输入相似的图片并反馈给用户。相似度的衡量可以基于图片辅助信息(如关键字)或者图片纹理、颜色、形状等图片内容特征。基于内容的图像检索是计算视觉在图像检索领域的应用。此类算法旨在避免使用文本信息检索图像,而是通过图片自身的纹理、颜色、形状等特征来进行检索。这类算法需要计算检索图像和数据库图像在特征空间中的欧氏距离。在大规模数据集中,使用实值特征的存储开销和检索时计算欧氏距离的时间开销都是难以接受的。基于哈希的图像检索可以解决上述时间、存储开销过大的问题。基于哈希的图像检索算法使用二值特征而非实值特征存储和检索图像。二值特征之间的距离计算可以利用异或操作快速实现,同时由于二值特征中的每一位只需要1比特的存储空间,因此可以明显减少数据库图片特征的存储开销。二值特征被称为哈希特征,从原始空间映射到汉明空间的函数称为哈希函数,学习得到哈希特征的过程被称作哈希学习。哈希学习中最大的难点在于求解最优哈希特征的优化问题是NP难问题。这是由哈希特征的值只能取0,1或者±1的属性决定的。这个整数优化问题无法通过传统的数值优化方法求解最优解,因此需要对约束条件进行放松。放松方法主要有三类:直接丢弃二值约束,引入量化误差优化项,将阶跃函数放松为sigmoid函数。第一种方法由于直接忽略的了约束条件,因此学到的哈希函数必然存在巨大的量化误差。第二种方法需要引入实值的隐含层特征以及其他辅助变量,将原始的整数优化问题分解成多个可解的子问题,通过分步迭代优化的方法寻求局部最优解。有时关于哈希特征的子优化问题仍然是没有闭式解的NP难问题,需要通过协调下降法,收敛到这个子问题的一个局部最优解。第三种方法由于引入非线性函数,训练模型收敛速度明显减慢。无论采用上述哪种方法,训练得到的哈希函数Φ与实际使用的哈希函数Ψ=sgn(Φ)之间总会有差异。这会导致在采样集外的数据上检索效果下降。此外,当训练数据以pairwise数据对的形式给出时,先前方法都是将相似图片对的监督标记定义为1,不相似的图片对的监督标记定义为0或-1。由于绝大多数训练集上构造出来的pairwise数据对中相似的数量总会远远小于不相似的数量,因此会产生正负训练样本不均衡的问题。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的目的在于提出一种基于二值特征的大规模图像检索算法,该方法可以有效提高检索精度。为达到上述目的,本专利技术实施例提出了一种基于二值特征的大规模图像检索算法,包括以下步骤:步骤S1:初始化神经网络参数,并根据训练图片集初始化实值输出特征;步骤S2:根据所述训练图片集构建图片相似度矩阵,并构建拉普拉斯矩阵;步骤S3:通过加权相似度度量构建损失函数;步骤S4:通过所述损失函数对实值输出特征求导,固定差异量更新所述实值输出特征,同时更新网络参数;步骤S5:通过所述损失函数对差异量求导,固定所述实值输出特征更新所述差异量;步骤S6:增大高阶展开权重,并依照所述步骤S3与所述步骤S4且结合所述损失函数持续更新所述实值输出特征与所述网络参数,直到训练结束。本专利技术实施例的基于二值特征的大规模图像检索算法,通过将哈希学习中原始的二值优化问题转变为对哈希函数可导的优化问题,解耦了哈希学习中的二值约束和相似度保持目标,使得转换后的问题可以通过简单的交互迭代框架进行优化求解,并且通过加权相似度度量方法,有效补偿输入数据对中的正负训练样本不平衡带来的问题,有效解决训练得到的哈希函数和实际使用的哈希函数之间存在不一致的问题,提高检索精度。进一步地,在本专利技术的一个实施例中,所述步骤S1进一步包括:步骤S101:初始化神经网络参数;步骤S102:使用所述初始化的神经网络获取训练图片集中图片的实值输出特征,并将所述实值输出特征作为所述初始实值输出特征H与离散输出特征B=sgn(H),并以所述离散输出特征B作为图片哈希码。进一步地,在本专利技术的一个实施例中,所述步骤S2包括以下步骤:步骤S201:通过二值相似度函数,计算所述训练图片集中任意两个图片的相似度,记第i个图片和第j个图片的相似度为sij,其构成的图片相似度矩阵记为S;步骤S202:求取所述图片相似度矩阵S的拉普拉斯矩阵,记为Lsym。进一步地,在本专利技术的一个实施例中,所述步骤S202具体为:计算D=diag(d1,d2,......,dN),L=D-S;所述图片相似度矩阵S的拉普拉斯矩阵进一步地,在本专利技术的一个实施例中,所述步骤S3包括以下步骤:步骤S301:使用加权相似度度量方法补偿正负训练样本的不平衡,通过所述相似度计算所述训练图片集中任意两个图片的加权相似度,记第i个图片和第j个图片的加权相似度为其构成的加权相似度矩阵记为步骤S302:对于所述训练图片集任意图片i与j,根据所述离散输出特征bi与bj,构建损失函数:步骤S303:对所述训练图片集中所有样本对求和,构建损失函数:所述损失函数矩阵形式为:其中,D为对角阵,且对角元素步骤S304:定义差异量Δ=B-H,根据泰勒级数,所述损失函数在实值输出特征H处展开如下:其中,若实值输出特征H与差异量Δ按列方式连接各元素,则是实值输出特征H的第i列向量,是差异量Δ的第i列向量;步骤S305:根据所述步骤S304的展开形式,所述步骤S303中所述损失函数即为:步骤S306:结合所述步骤S303与所述步骤S305,关于所述实值输出特征H与差异量Δ构建所述损失函数:其中,(H+Δ)∈{-1,1}n×l,其中λ1与λ2为高阶展开权重。进一步地,在本专利技术的一个实施例中,所述步骤S301具体为:对于所述训练图片集任意图片i与j,根据所述相似度sij计算加权相似度:为确保相似度量中,所述相似图片对所述相似度为正值,非相似图片对所述相似度为负值,令0<β<1,若β=0.5,则通过0.5倍放缩得到原相似度,未使用加权相似度度量方法。进一步地,在本专利技术的一个实施例中,所述步骤S4包括以下步骤:步骤S401:固定差异量,关于所述实值输出特征构建所述损失函数:步骤S402:固定差异量,计算所述损失函数对所述实值输出特征求导:步骤S403:根据随机梯度下降法更新实值输出特征与网络参数。进一步地,在本专利技术的一个实施例中,所述步骤S5包括以下步骤:步骤S501:固定所述实值输出特征,关于差异量构建损失函数:满足(H+Δ)∈{-1,1}n×l;步骤S502:固定实值输出特征,计算所述损失函数对差异量求导:步骤S503:更新差异量Δ。进一步地,在本专利技术的一个实施例中,所述步骤S503具体为:根据迭代更新差异量。进一步地,在本专利技术的一个实施例中,所述步骤S6包括以下步骤:步骤S601:增大高阶展开权重λ1与λ2;步骤S602:依照所述步骤S4与所述步骤S5,结合所述损失函数持续更新实值输出特征与网络参数,直到训练结束。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附本文档来自技高网
...

【技术保护点】
1.一种基于二值特征的大规模图像检索算法,其特征在于,包括以下步骤:步骤S1:初始化神经网络参数,并根据训练图片集初始化实值输出特征;步骤S2:根据所述训练图片集构建图片相似度矩阵,并构建拉普拉斯矩阵;步骤S3:通过加权相似度度量构建损失函数;步骤S4:通过所述损失函数对实值输出特征求导,固定差异量更新所述实值输出特征,同时更新网络参数;步骤S5:通过所述损失函数对差异量求导,固定所述实值输出特征更新所述差异量;以及步骤S6:增大高阶展开权重,并依照所述步骤S3与所述步骤S4且结合所述损失函数持续更新所述实值输出特征与所述网络参数,直到训练结束。

【技术特征摘要】
1.一种基于二值特征的大规模图像检索算法,其特征在于,包括以下步骤:步骤S1:初始化神经网络参数,并根据训练图片集初始化实值输出特征;步骤S2:根据所述训练图片集构建图片相似度矩阵,并构建拉普拉斯矩阵;步骤S3:通过加权相似度度量构建损失函数;步骤S4:通过所述损失函数对实值输出特征求导,固定差异量更新所述实值输出特征,同时更新网络参数;步骤S5:通过所述损失函数对差异量求导,固定所述实值输出特征更新所述差异量;以及步骤S6:增大高阶展开权重,并依照所述步骤S3与所述步骤S4且结合所述损失函数持续更新所述实值输出特征与所述网络参数,直到训练结束。2.根据权利要求1所述的基于二值特征的大规模图像检索算法,其特征在于,所述步骤S1进一步包括:步骤S101:初始化神经网络参数;步骤S102:使用所述初始化的神经网络获取训练图片集中图片的实值输出特征,并将所述实值输出特征作为所述初始实值输出特征H与离散输出特征B=sgn(H),并以所述离散输出特征B作为图片哈希码。3.根据权利要求1所述的基于二值特征的大规模图像检索算法,其特征在于,所述步骤S2包括以下步骤:步骤S201:通过二值相似度函数,计算所述训练图片集中任意两个图片的相似度,记第i个图片和第j个图片的相似度为sij,其构成的图片相似度矩阵记为S;步骤S202:求取所述图片相似度矩阵S的拉普拉斯矩阵,记为Lsym。4.根据权利要求3所述的基于二值特征的大规模图像检索算法,其特征在于,所述步骤S202具体为:计算D=diag(d1,d2,......,dN),L=D-S;所述图片相似度矩阵S的拉普拉斯矩阵5.根据权利要求2或3所述的基于二值特征的大规模图像检索算法,其特征在于,所述步骤S3包括以下步骤:步骤S301:使用加权相似度度量方法补偿正负训练样本的不平衡,通过所述相似度计算所述训练图片集中任意两个图片的加权相似度,记第i个图片和第j个图片的加权相似度为其构成的加权相似度矩阵记为步骤S302:对于所述训练图片集任意图片i与j,根据所述离散输出特征bi与bj,构建损失函数:步骤S303:对所述训练图片集中所有样本对求和,构建...

【专利技术属性】
技术研发人员:鲁继文周杰陈志祥袁鑫
申请(专利权)人:清华大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1