大规模图片集中基于语义一致性的近似搜索方法技术

技术编号：16153218 阅读：22 留言：0更新日期：2017-09-06 18:28

本发明专利技术公开了一种在大规模图片集中基于语义一致性的近似搜索方法，包括转换矩阵训练过程：在计算图片集中的图片和抽样图片的相似度时引入语义一致性，并获得下一阶段所需的转换矩阵；哈希编码过程：根据训练过程得到的转换矩阵计算出图片和抽样图片之间的优化相似度，并根据优化相似度构建相似矩阵进而利用哈希编码技术对图片集中的各图片进行二进制编码；然后比较新的查询图片和各图片二进制编码的汉明距离，从而找到查询图片的近邻。本发明专利技术在对图片进行相似性度量时引入语义一致特性，可以更为准确的度量图片之间的相似性，使用随机梯度下降法来减少算法的训练时间，能够有效地应用于大规模的图片数据集中。

全部详细技术资料下载

【技术实现步骤摘要】
大规模图片集中基于语义一致性的近似搜索方法
本专利技术涉及一种在大规模图片数据集中对图片进行近似搜索的方法，属于机器学习

技术介绍
近邻查询中一个重要的应用就是图片的近似搜索。在大数据时代，图片数据最明显的特点是数据规模极大，图片本身的特征维度很高。对于海量高维图片高效准确的近邻查询对计算机视觉、机器学习等前沿学科的研究有着极为重要的应用价值。传统的近邻查询算法，比如基于树的索引结构的搜索算法，这种搜索算法都存在着维度的问题。由于对高维图片数据进行近似近邻搜索时性能急剧下滑，已不适用于当今的大数据时代。现在最为流行的方法是基于哈希技术的近似近邻搜索，经典的近似搜索哈希算法如局部敏感哈希算法(LSH)，通过将近邻搜索问题转换为寻找相似的二进制编码来解决。基于哈希技术的近似搜索算法具有更为简单的索引结构和更少的存储空间。但是LSH为了同时保证精度和召回率，需要构建多个哈希表，导致查询时间和存储开销的大幅增加。随之又出现了可以产生更为高效编码的哈希算法，一种基于图的哈希算法由于可以更好的度量图片样本之间的相似性从而能够获得更好的性能。比如谱哈希(SH)算法，锚哈希(AGH)算法。但是这些算法在寻找近邻图片时过于片面，它们只考虑了图片在数据集中的实际存储位置，而没有考虑图片可能具有的语义标记信息，这样使得这些算法在图片近似搜索中的性能较差。在现实的大规模图片数据集中，很多图片具有语义标记信息，不同的类标记信息代表图片属于不同的类别。比如两张图片在数据集中可能实际存储距离较远，但是它们具有相同的类标记“天空”，那么这两张图片也是近似图片。而且目前流行的图片...
大规模图片集中基于语义一致性的近似搜索方法

【技术保护点】
在大规模图片集中基于语义一致性的近似搜索方法，其特征在于：所述方法包括如下步骤：步骤1：输入图片集样本矩阵X，并输入图片集对应的语义类标记矩阵Y，其中X是n*d维的矩阵，Y是n*c维的矩阵，n是图片样本的个数，d是图片特征的维度，c是类标记的数量；步骤2：从图片集中随机抽取一部分图片作为抽样图片集；步骤3：定义图片集与抽样图片集中的图片间的关系矩阵W，结合关系矩阵并引入语义一致性构建目标函数表达式，通过随机梯度下降算法迭代求解优化，待表达式收敛后即得到优化完成的转换矩阵A；步骤4：对于每一个图片样本x，将转换矩阵A代入步骤3定义的关系矩阵中，得到关系矩阵的各个元素的值；通过关系矩阵构建出相似矩阵Z，结合相似矩阵得到编码矩阵，对大规模图片数据集中的各图片利用编码矩阵进行哈希编码，将图片由原始的d维特征压缩映射成k维的二进制编码；步骤5：对于一个新的查询图片q，通过编码矩阵计算出查询图片的二进制编码，与图片数据集中各图片的二进制编码比较汉明距离，如果汉明距离小于设定的门限阈值r，即认为两图片是近似图片。

【技术特征摘要】
1.在大规模图片集中基于语义一致性的近似搜索方法，其特征在于：所述方法包括如下步骤：步骤1：输入图片集样本矩阵X，并输入图片集对应的语义类标记矩阵Y，其中X是n*d维的矩阵，Y是n*c维的矩阵，n是图片样本的个数，d是图片特征的维度，c是类标记的数量；步骤2：从图片集中随机抽取一部分图片作为抽样图片集；步骤3：定义图片集与抽样图片集中的图片间的关系矩阵W，结合关系矩阵并引入语义一致性构建目标函数表达式，通过随机梯度下降算法迭代求解优化，待表达式收敛后即得到优化完成的转换矩阵A；步骤4：对于每一个图片样本x，将转换矩阵A代入步骤3定义的关系矩阵中，得到关系矩阵的各个元素的值；通过关系矩阵构建出相似矩阵Z，结合相似矩阵得到编码矩阵，对大规模图片数据集中的各图片利用编码矩阵进行哈希编码，将图片由原始的d维特征压缩映射成k维的二进制编码；步骤5：对于一个新的查询图片q，通过编码矩阵计算出查询图片的二进制编码，与图片数据集中各图片的二进制编码比较汉明距离，如果汉明距离小于设定的门限阈值r，即认为两图片是近似图片。2.根据权利要求1所述的近似搜索方法，其特征在于：转换矩阵A的计算过程如下：步骤(1)、定义图片间的关系矩阵W是一个n*n维的矩阵，关系矩阵中的每一个元素定义为：Wij＝exp(-||A(xi-uj)||2)(1)上式中A表示转换矩阵，xi表示图片集中的第i张图片，uj表示抽样图片集中的第j张图片；步骤(2)、定义目标函数式为：其中，fi表示第i个图片样本的类标记向量，类标记向量是c维的列向量，向量中元素的值为1或0，分别表示图片属于这个类和不属于这个类，fj表示抽样图片集中图片的类标记向量，||fi-fj||2即是在训练转换矩阵时引入的语义一致性质；步骤(3)、根据随机梯度下降算法优化转换矩阵A，迭代更新规则如下：其中，γt是每次迭代过程中的优化步长，转换矩阵的初始值...

【专利技术属性】
技术研发人员：胡鸣珂，胡海峰，吕成钢，
申请(专利权)人：胡海峰，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人