【技术实现步骤摘要】
大规模图片集中基于语义一致性的近似搜索方法
本专利技术涉及一种在大规模图片数据集中对图片进行近似搜索的方法,属于机器学习
技术介绍
近邻查询中一个重要的应用就是图片的近似搜索。在大数据时代,图片数据最明显的特点是数据规模极大,图片本身的特征维度很高。对于海量高维图片高效准确的近邻查询对计算机视觉、机器学习等前沿学科的研究有着极为重要的应用价值。传统的近邻查询算法,比如基于树的索引结构的搜索算法,这种搜索算法都存在着维度的问题。由于对高维图片数据进行近似近邻搜索时性能急剧下滑,已不适用于当今的大数据时代。现在最为流行的方法是基于哈希技术的近似近邻搜索,经典的近似搜索哈希算法如局部敏感哈希算法(LSH),通过将近邻搜索问题转换为寻找相似的二进制编码来解决。基于哈希技术的近似搜索算法具有更为简单的索引结构和更少的存储空间。但是LSH为了同时保证精度和召回率,需要构建多个哈希表,导致查询时间和存储开销的大幅增加。随之又出现了可以产生更为高效编码的哈希算法,一种基于图的哈希算法由于可以更好的度量图片样本之间的相似性从而能够获得更好的性能。比如谱哈希(SH)算法,锚 ...
【技术保护点】
在大规模图片集中基于语义一致性的近似搜索方法,其特征在于:所述方法包括如下步骤:步骤1:输入图片集样本矩阵X,并输入图片集对应的语义类标记矩阵Y,其中X是n*d维的矩阵,Y是n*c维的矩阵,n是图片样本的个数,d是图片特征的维度,c是类标记的数量;步骤2:从图片集中随机抽取一部分图片作为抽样图片集;步骤3:定义图片集与抽样图片集中的图片间的关系矩阵W,结合关系矩阵并引入语义一致性构建目标函数表达式,通过随机梯度下降算法迭代求解优化,待表达式收敛后即得到优化完成的转换矩阵A;步骤4:对于每一个图片样本x,将转换矩阵A代入步骤3定义的关系矩阵中,得到关系矩阵的各个元素的值;通过 ...
【技术特征摘要】
1.在大规模图片集中基于语义一致性的近似搜索方法,其特征在于:所述方法包括如下步骤:步骤1:输入图片集样本矩阵X,并输入图片集对应的语义类标记矩阵Y,其中X是n*d维的矩阵,Y是n*c维的矩阵,n是图片样本的个数,d是图片特征的维度,c是类标记的数量;步骤2:从图片集中随机抽取一部分图片作为抽样图片集;步骤3:定义图片集与抽样图片集中的图片间的关系矩阵W,结合关系矩阵并引入语义一致性构建目标函数表达式,通过随机梯度下降算法迭代求解优化,待表达式收敛后即得到优化完成的转换矩阵A;步骤4:对于每一个图片样本x,将转换矩阵A代入步骤3定义的关系矩阵中,得到关系矩阵的各个元素的值;通过关系矩阵构建出相似矩阵Z,结合相似矩阵得到编码矩阵,对大规模图片数据集中的各图片利用编码矩阵进行哈希编码,将图片由原始的d维特征压缩映射成k维的二进制编码;步骤5:对于一个新的查询图片q,通过编码矩阵计算出查询图片的二进制编码,与图片数据集中各图片的二进制编码比较汉明距离,如果汉明距离小于设定的门限阈值r,即认为两图片是近似图片。2.根据权利要求1所述的近似搜索方法,其特征在于:转换矩阵A的计算过程如下:步骤(1)、定义图片间的关系矩阵W是一个n*n维的矩阵,关系矩阵中的每一个元素定义为:Wij=exp(-||A(xi-uj)||2)(1)上式中A表示转换矩阵,xi表示图片集中的第i张图片,uj表示抽样图片集中的第j张图片;步骤(2)、定义目标函数式为:其中,fi表示第i个图片样本的类标记向量,类标记向量是c维的列向量,向量中元素的值为1或0,分别表示图片属于这个类和不属于这个类,fj表示抽样图片集中图片的类标记向量,||fi-fj||2即是在训练转换矩阵时引入的语义一致性质;步骤(3)、根据随机梯度下降算法优化转换矩阵A,迭代更新规则如下:其中,γt是每次迭代过程中的优化步长,转换矩阵的初始值...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。