当前位置: 首页 > 专利查询>胡海峰专利>正文

大规模图片集中基于语义一致性的近似搜索方法技术

技术编号:16153218 阅读:22 留言:0更新日期:2017-09-06 18:28
本发明专利技术公开了一种在大规模图片集中基于语义一致性的近似搜索方法,包括转换矩阵训练过程:在计算图片集中的图片和抽样图片的相似度时引入语义一致性,并获得下一阶段所需的转换矩阵;哈希编码过程:根据训练过程得到的转换矩阵计算出图片和抽样图片之间的优化相似度,并根据优化相似度构建相似矩阵进而利用哈希编码技术对图片集中的各图片进行二进制编码;然后比较新的查询图片和各图片二进制编码的汉明距离,从而找到查询图片的近邻。本发明专利技术在对图片进行相似性度量时引入语义一致特性,可以更为准确的度量图片之间的相似性,使用随机梯度下降法来减少算法的训练时间,能够有效地应用于大规模的图片数据集中。

【技术实现步骤摘要】
大规模图片集中基于语义一致性的近似搜索方法
本专利技术涉及一种在大规模图片数据集中对图片进行近似搜索的方法,属于机器学习

技术介绍
近邻查询中一个重要的应用就是图片的近似搜索。在大数据时代,图片数据最明显的特点是数据规模极大,图片本身的特征维度很高。对于海量高维图片高效准确的近邻查询对计算机视觉、机器学习等前沿学科的研究有着极为重要的应用价值。传统的近邻查询算法,比如基于树的索引结构的搜索算法,这种搜索算法都存在着维度的问题。由于对高维图片数据进行近似近邻搜索时性能急剧下滑,已不适用于当今的大数据时代。现在最为流行的方法是基于哈希技术的近似近邻搜索,经典的近似搜索哈希算法如局部敏感哈希算法(LSH),通过将近邻搜索问题转换为寻找相似的二进制编码来解决。基于哈希技术的近似搜索算法具有更为简单的索引结构和更少的存储空间。但是LSH为了同时保证精度和召回率,需要构建多个哈希表,导致查询时间和存储开销的大幅增加。随之又出现了可以产生更为高效编码的哈希算法,一种基于图的哈希算法由于可以更好的度量图片样本之间的相似性从而能够获得更好的性能。比如谱哈希(SH)算法,锚哈希(AGH)算法。但是这些算法在寻找近邻图片时过于片面,它们只考虑了图片在数据集中的实际存储位置,而没有考虑图片可能具有的语义标记信息,这样使得这些算法在图片近似搜索中的性能较差。在现实的大规模图片数据集中,很多图片具有语义标记信息,不同的类标记信息代表图片属于不同的类别。比如两张图片在数据集中可能实际存储距离较远,但是它们具有相同的类标记“天空”,那么这两张图片也是近似图片。而且目前流行的图片近似搜索算法应用在大规模图片数据集上时往往性能较差,不能很好的解决实际问题。
技术实现思路
本专利技术所要解决的技术问题是:提供一种应用于大规模图片数据集中的基于语义一致性的近似图片搜索方法。主要解决图片的近似搜索问题并将相似的图片通过哈希技术映射成相同或相似的二进制编码。本专利技术为解决上述技术问题采用以下技术方案:本专利技术提出一种在大规模图片集中基于语义一致性的近似搜索方法,所述方法包括如下步骤:步骤1:输入图片集样本矩阵X,并输入图片集对应的语义类标记矩阵Y,其中X是n*d维的矩阵,Y是n*c维的矩阵,n是图片样本的个数,d是图片特征的维度,c是类标记的数量;步骤2:从图片集中随机抽取一部分图片作为抽样图片集;步骤3:定义图片集与抽样图片集中的图片间的关系矩阵W,结合关系矩阵并引入语义一致性构建目标函数表达式,通过随机梯度下降算法迭代求解优化,待表达式收敛后即得到优化完成的转换矩阵A;步骤4:对于每一个图片样本x,将转换矩阵A代入步骤3定义的关系矩阵中,得到关系矩阵的各个元素的值;通过关系矩阵构建出相似矩阵Z,结合相似矩阵得到编码矩阵,对大规模图片数据集中的各图片利用编码矩阵进行哈希编码,将图片由原始的d维特征压缩映射成k维的二进制编码;步骤5:对于一个新的查询图片q,通过编码矩阵计算出查询图片的二进制编码,与图片数据集中各图片的二进制编码比较汉明距离,如果汉明距离小于设定的门限阈值r,即认为两图片是近似图片。进一步,本专利技术的近似搜索方法,转换矩阵A的计算过程如下:步骤(1)、定义图片间的关系矩阵W是一个n*n维的矩阵,关系矩阵中的每一个元素定义为:Wij=exp(-||A(xi-uj)||2)(1)上式中A表示转换矩阵,xi表示图片集中的第i张图片,uj表示抽样图片集中的第j张图片;步骤(2)、定义目标函数式为:其中,fi表示第i个图片样本的类标记向量,类标记向量是c维的列向量,向量中元素的值为1或0,分别表示图片属于这个类和不属于这个类,fj表示抽样图片集中图片的类标记向量,||fi-fj||2即是在训练转换矩阵时引入的语义一致性质;步骤(3)、根据随机梯度下降算法优化转换矩阵A,迭代更新规则如下:其中,γt是每次迭代过程中的优化步长,转换矩阵的初始值为I/δ,I是d*d维的单位矩阵,δ是图片集中各图片之间欧氏距离的中位数;步骤(4)、图片集中所有的图片样本遍历结束后,即得到最终优化完成的转换矩阵A。进一步,本专利技术的近似搜索方法,步长γt选取以下值中的一种:1*10-5,1*10-4,1*10-3,或者1*10-2。进一步,本专利技术的近似搜索方法,步骤4具体如下:步骤a、得到转换矩阵A后,再通过式(1)计算出每张图片和抽样图片之间的引入语义一致性后的优化相似度,即得到了关系矩阵W的各个元素的值,如果抽样图片集中有m张图片样本,那么通过关系矩阵构建出相似矩阵Z,Z矩阵计算公式定义如下:其中<i>集合代表的是抽样图片集,即只有当图片是属于抽样图片集中的图片时,才计算Z矩阵上对应元素的值,否则Z矩阵上对应元素值为0;步骤b、设抽样图片集合中图片的数量为m,构造一个m*m维的M矩阵,M矩阵定义如下:M=Λ-1/2ZTZΛ-1/2(5)其中Λ=diag(ZT1),是一个对角矩阵,计算得到M矩阵前k个最大的特征值组成的k*k维的对角矩阵:∑=diag(δ1,...,δk)∈Rk×k和前k个最大的特征值对应的特征向量组成的m*k维的矩阵:V=[v1,...,vk]∈Rm×k;步骤c、由上式得到的各矩阵,构造出最终的编码矩阵Y,Y矩阵定义如下:Y是一个n*k维的矩阵,n代表图片集中图片的个数,k代表映射到二进制编码时编码的位数,编码矩阵Y的每行就是一个编码函数,各图片通过编码函数计算得到一个k维的向量,再对此向量进行二值化分割:sgn(y),就得到了图片集中各图片的二进制编码。进一步,本专利技术的近似搜索方法,r选取以下值中的一个:1,2,3,或4。本专利技术的关键技术分述如下:(1)基于语义一致的近似搜索算法基于语义一致的近似搜索算法是在计算图片数据集中各图片和抽样图片集中图片的相似度时引入语义一致性,构建出包含语义信息的目标函数表达式。然后用随机梯度下降算法迭代求解,表达式收敛后即得到反映图片间内在语义一致特性的转换矩阵。再利用哈希技术把图片映射成k位的二进制编码,并使相似的输入图片映射成汉明距离相近的二进制编码。(2)随机梯度下降(SGD)算法:随机梯度下降算法作为梯度下降(GradientDescent,GD)算法的改进算法,其主要针对原始梯度下降算法收敛速度过慢和易陷入局部最优的问题,是一种最小化损失函数或风险函数的迭代求解方法。本专利技术利用随机梯度下降算法减少了语义一致近似搜索方法中转换矩阵的训练时间。本专利技术采用以上技术方案与现有技术相比,具有以下技术效果:1.解决了用传统的梯度下降算法收敛速度过慢的问题。2.使用转换矩阵计算图片之间的优化相似度,解决了使用传统的高斯核函数度量图片相似度时对敏感参数过于依赖的问题。3.使用哈希技术把d维的原始图片压缩映射成k比特的二进制编码,极大地提高了算法的效率并且极大的缩减了对内存空间的占用。附图说明图1是本专利技术的系统框架图。图2是本专利技术的方法流程图。具体实施方式下面结合附图对本专利技术的技术方案做进一步的详细说明:本专利技术在对图片进行相似性度量时引入语义一致特性,可以更为准确的度量图片之间的相似性。并生成抽样图片集计算引入语义一致性后的优化相似度,以及使用随机梯度下降法来减少算法的训练时间,使算法能够有效地应用于大本文档来自技高网
...
大规模图片集中基于语义一致性的近似搜索方法

【技术保护点】
在大规模图片集中基于语义一致性的近似搜索方法,其特征在于:所述方法包括如下步骤:步骤1:输入图片集样本矩阵X,并输入图片集对应的语义类标记矩阵Y,其中X是n*d维的矩阵,Y是n*c维的矩阵,n是图片样本的个数,d是图片特征的维度,c是类标记的数量;步骤2:从图片集中随机抽取一部分图片作为抽样图片集;步骤3:定义图片集与抽样图片集中的图片间的关系矩阵W,结合关系矩阵并引入语义一致性构建目标函数表达式,通过随机梯度下降算法迭代求解优化,待表达式收敛后即得到优化完成的转换矩阵A;步骤4:对于每一个图片样本x,将转换矩阵A代入步骤3定义的关系矩阵中,得到关系矩阵的各个元素的值;通过关系矩阵构建出相似矩阵Z,结合相似矩阵得到编码矩阵,对大规模图片数据集中的各图片利用编码矩阵进行哈希编码,将图片由原始的d维特征压缩映射成k维的二进制编码;步骤5:对于一个新的查询图片q,通过编码矩阵计算出查询图片的二进制编码,与图片数据集中各图片的二进制编码比较汉明距离,如果汉明距离小于设定的门限阈值r,即认为两图片是近似图片。

【技术特征摘要】
1.在大规模图片集中基于语义一致性的近似搜索方法,其特征在于:所述方法包括如下步骤:步骤1:输入图片集样本矩阵X,并输入图片集对应的语义类标记矩阵Y,其中X是n*d维的矩阵,Y是n*c维的矩阵,n是图片样本的个数,d是图片特征的维度,c是类标记的数量;步骤2:从图片集中随机抽取一部分图片作为抽样图片集;步骤3:定义图片集与抽样图片集中的图片间的关系矩阵W,结合关系矩阵并引入语义一致性构建目标函数表达式,通过随机梯度下降算法迭代求解优化,待表达式收敛后即得到优化完成的转换矩阵A;步骤4:对于每一个图片样本x,将转换矩阵A代入步骤3定义的关系矩阵中,得到关系矩阵的各个元素的值;通过关系矩阵构建出相似矩阵Z,结合相似矩阵得到编码矩阵,对大规模图片数据集中的各图片利用编码矩阵进行哈希编码,将图片由原始的d维特征压缩映射成k维的二进制编码;步骤5:对于一个新的查询图片q,通过编码矩阵计算出查询图片的二进制编码,与图片数据集中各图片的二进制编码比较汉明距离,如果汉明距离小于设定的门限阈值r,即认为两图片是近似图片。2.根据权利要求1所述的近似搜索方法,其特征在于:转换矩阵A的计算过程如下:步骤(1)、定义图片间的关系矩阵W是一个n*n维的矩阵,关系矩阵中的每一个元素定义为:Wij=exp(-||A(xi-uj)||2)(1)上式中A表示转换矩阵,xi表示图片集中的第i张图片,uj表示抽样图片集中的第j张图片;步骤(2)、定义目标函数式为:其中,fi表示第i个图片样本的类标记向量,类标记向量是c维的列向量,向量中元素的值为1或0,分别表示图片属于这个类和不属于这个类,fj表示抽样图片集中图片的类标记向量,||fi-fj||2即是在训练转换矩阵时引入的语义一致性质;步骤(3)、根据随机梯度下降算法优化转换矩阵A,迭代更新规则如下:其中,γt是每次迭代过程中的优化步长,转换矩阵的初始值...

【专利技术属性】
技术研发人员:胡鸣珂胡海峰吕成钢
申请(专利权)人:胡海峰
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1