一种图像特征点匹配方法组成比例

技术编号:16064143 阅读:52 留言:0更新日期:2017-08-22 16:41
本发明专利技术公开了一种图像特征点匹配方法,包括以下步骤,入库图片特征点提取:提取入库图像的特征并构成入库特征向量,对其维度进行降维;向量入库:分割降维后的入库特征向量,并对分割后的每部分先做乘积量化再做向量量化,构成乘积量化器、向量量化器,并建立检索树和哈希表;待匹配图片特征点提取:提取待匹配图像的特征并构成待匹配特征向量,对其维度进行降维;向量匹配:分割降维后的待匹配特征向量,找出待匹配特征向量与乘积量化器、向量量化器的聚类中心距离靠前的多个聚类中心,根据检索树和哈希表找到多个聚类中心所对应的图片并构成候选集,采用浮点向量计算候选集中与待匹配特征向量的距离最近的图片;其速度快且精度高。

An image feature point matching method

The invention discloses an image feature point matching method, which comprises the following steps: storage, image feature extraction and image feature extraction in a storage feature vector is used to reduce the dimensionality of the vector dimension; storage: storage segmentation feature vector after dimensionality reduction, and for each part of the segmented first product to quantify do a product quantizer, vector quantization, vector quantizer, and the establishment of the search tree and Hasibiu; matching image feature extraction: extracted feature matching and image matching of feature vectors is used to reduce the dimensionality of the dimension; to match: segmentation matching feature vector after dimensionality reduction, to find out the distance from the cluster center matching feature vector quantizer, and the product of vector quantization for multiple cluster center front, according to the search tree and hash table to find the corresponding multiple clustering center image A candidate set is used to compute the closest distance between the candidate concentration and the characteristic vector to be matched by floating point vectors.

【技术实现步骤摘要】
一种图像特征点匹配方法
本专利技术涉及图片搜索
,具体涉及一种图像特征点匹配方法。
技术介绍
在图像搜索领域,特征匹配是非常重要的一个环节,特点的匹配效率和精度决定着最终搜索速度和精度。现有图片搜索时,其采用以下步骤:第一步通过大量样本数据训练一个转换矩阵,通过哈希函数转二进制码,二进制码分段,生成多个哈希表,得到的分段二进制码直接作为哈希表的入口。第二步,当待查询向量达到时,通过同样的方式转为二进制码,映射到对应的哈希表入口及其距离为r的其他入口中,入口中的所有图片作为候选集。第三步,将候选集中所有的图片特征向量与待查询向量做完整的海明距离计算,重排距离即可。在浮点特征向量转二进制码时,由于哈希函数的存在,导致向量的精度丢失,并且在最后的重新排序过程当中,依然使用基于二进制码的海明距离计算,虽然速度很快,但是由于二进制码的表示精度不如浮点向量,因此召唤率会有一定程度降低。随着互联网的飞速发展,目前互联网上的图片已经达到了百亿级别甚至更高。采用现有的特征点匹配方法,其已经不能适应现有快速增长的图片库模式。在海量图片检索树中怎样进行高效、高精度的搜索成为了热点。
技术实现思路
本专利技术为了解决上述技术问题提供一种图像特征点匹配方法,其匹配精度高且速度快。本专利技术通过下述技术方案实现:一种图像特征点匹配方法,包括以下步骤,入库图片特征点提取:提取入库图像的特征并构成入库特征向量,对其维度进行降维;向量入库:分割降维后的入库特征向量,并对分割后的每部分先做乘积量化再做向量量化,构成乘积量化器、向量量化器,并建立检索树和哈希表;待匹配图片特征点提取:提取待匹配图像的特征并构成待匹配特征向量,对其维度进行降维;向量匹配:分割降维后的待匹配特征向量,找出待匹配特征向量与乘积量化器、向量量化器的聚类中心距离靠前的多个聚类中心,根据检索树和哈希表找到多个聚类中心所对应的图片并构成候选集,采用浮点向量计算候选集中与待匹配特征向量的距离最近的图片。本方案的方法不使用类似迭代量化的算法计算二进制码,采用降维聚类构建检索树和哈希表,在第一层次的聚类时,不对其完全相关的数据进行聚类,而是对其进行分割,各部分数据完全独立,可采用多线程并行处理方式进行加速,将量化器的训练时间大大减少。匹配检索的整个过程分两段进行,第一段为选取候选集,第二段使用浮点向量整体进行距离计算,在候选集范围较大的前提下,再进行浮点距离计算,检索结果的召回率和暴力匹配的差距很小,不超过1个百分点。比海明距离排序更精确。如果数据库中有N条记录,暴力匹配需要做N次距离计算,而采用本方案的方法,根据所选参数的不同,候选集中的记录数为N/100~N/10,大大减少了计算了,大大提高了匹配速度。且在构建检索树的过程中,第一阶段聚类的数据分割成多个部分,多个部分的聚类过程是完全独立的,因此可以使用多线程技术进行聚类,提高聚类速度。作为优选,向量入库的方法为:将入库特征向量分割成不相交的P个部分;在每个部分内部进行聚类中心个数为k1的k-means聚类;针对每个聚类中心,将所有分配到该聚类中心的数据做向量量化,聚类中心个数为k2;用P个哈希表分别记录映射到对应聚类中心的所有特征的ID或对应图片的名称。进一步的,向量匹配的具体方法为:将待匹配特征向量分割成不相交的P个部分;在每个部分内部,计算待匹配特征向量与k1个聚类中心的距离,并选择距离最小的W个聚类中心;针对选取的W个聚类中心,将待匹配特征向量与该聚类中心对应的k2个第二层聚类中心一一进行距离计算,得到k2个距离;对W*k2个距离进行排序,取距离最近的m个距离,其中,m为大于1的自然数;取出m个距离对应的聚类中心,找到对应的哈希表入口,将这些入口中的图片名称或者ID构成候选集;将候选集中的图片ID对应的图片特征向量与待匹配特征向量采用浮点向量一一计算进距离,最后得到距离最小的即为目标。进一步的,所述k-means聚类采用并行处理方式。作为优选,采用主成分分析方法对特征的维度降维。本专利技术与现有技术相比,具有如下的优点和有益效果:本专利技术采用降维聚类构建检索树和哈希表,在第一层次的聚类时,对其进行分割,各部分数据完全独立,可采用多线程并行处理方式进行加速,将量化器的训练时间大大减少;匹配检索的过程先选取候选集,再使用浮点向量整体进行距离计算,在候选集范围较大的前提下,进行浮点距离计算,检索结果的召回率和暴力匹配的差距很小,不超过1个百分点,其检索精度高且高效。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,下面结合实施例,对本专利技术作进一步的详细说明,本专利技术的示意性实施方式及其说明仅用于解释本专利技术,并不作为对本专利技术的限定。实施例1一种图像特征点匹配方法,包括以下步骤,入库图片特征点提取:提取入库图像的特征并构成入库特征向量,对其维度进行降维;向量入库:分割降维后的入库特征向量,并对分割后的每部分先做乘积量化再做向量量化,构成乘积量化器、向量量化器,并建立检索树和哈希表;待匹配图片特征点提取:提取待匹配图像的特征并构成待匹配特征向量,对其维度进行降维;向量匹配:分割降维后的待匹配特征向量,找出待匹配特征向量与乘积量化器、向量量化器的聚类中心距离靠前的多个聚类中心,根据检索树和哈希表找到多个聚类中心所对应的图片并构成候选集,采用浮点向量计算候选集中与待匹配特征向量的距离最近的图片。采用该方法,在检索过程中,不仅考虑了完全命中的哈希入口,还考虑了其附近的几个入口,因此,增大了与查询图片最相似图片在候选集中的概率,提高了召回率。在进行重排序时,使用了原始浮点特征向量进行距离计算,这种方式保留了原始浮点特征向量全部的信息,而经过量化成为二进制特征码的方式都有一定程度的精度损失。实施例2基于上述实施例的思想,本实施例对各步骤进行了细化。不管是针对作为检索树入库的图片还在待匹配的图片,均需要提取特征点,其特征点的提取方法很多,譬如卷积神经网络,其输出特征向量的维度是一个比较大的值,可设定为n,n可能为128、256或者512等。其维度较大,会增大匹配过程的计算量,我们需要对其进行降维,降维可采用主成分分析方法将输出的特征向量的维度降为d维,其中,d小于等于n,d可取128或者64。采用降维的方法不仅可去除噪声的影响,且可减小计算量,减小计算时间。降维具体过程如下:假设有S条数据,在原始空间中,S条n维特征向量可由矩阵M={D1,D2,…Dn}表示,其中Dn为S*1的列向量。首先,矩阵M求协方差得到矩阵Var(M),Var(M)=MTM*1/n,再利用现有方法对协方差矩阵Var(M)求n个特征值和对应的特征向量,选取最大的d个特征值以及其对应的向量,作为降维的矩阵R,计算MR就能得到一个L*d的矩阵,完成了降维的过程。提取入库图片的特征并降维后为向量入库构建检索树做准备,向量入库的具体方法为:将入库特征向量分割成不相交的P个部分,譬如对d=128维的数据切割成P=4部分,将特征向量的第1~32个浮点数作为第一部分,第33~64个浮点数作为第二部分,第65~96个浮点数作为第三部分,第97~128个浮点数作为第四部分。在每个部分内部进行聚类中心个数为k1的k-means聚类,此处为第一层量化,以第一部分为例说明其具体过程:1-本文档来自技高网...

【技术保护点】
一种图像特征点匹配方法,其特征在于,包括以下步骤,入库图片特征点提取:提取入库图像的特征并构成入库特征向量,对其维度进行降维;向量入库:分割降维后的入库特征向量,并对分割后的每部分先做乘积量化再做向量量化,构成乘积量化器、向量量化器,并建立检索树和哈希表;待匹配图片特征点提取:提取待匹配图像的特征并构成待匹配特征向量,对其维度进行降维;向量匹配:分割降维后的待匹配特征向量,找出待匹配特征向量与乘积量化器、向量量化器的聚类中心距离靠前的多个聚类中心,根据检索树和哈希表找到多个聚类中心所对应的图片并构成候选集,采用浮点向量计算候选集中与待匹配特征向量的距离最近的图片。

【技术特征摘要】
1.一种图像特征点匹配方法,其特征在于,包括以下步骤,入库图片特征点提取:提取入库图像的特征并构成入库特征向量,对其维度进行降维;向量入库:分割降维后的入库特征向量,并对分割后的每部分先做乘积量化再做向量量化,构成乘积量化器、向量量化器,并建立检索树和哈希表;待匹配图片特征点提取:提取待匹配图像的特征并构成待匹配特征向量,对其维度进行降维;向量匹配:分割降维后的待匹配特征向量,找出待匹配特征向量与乘积量化器、向量量化器的聚类中心距离靠前的多个聚类中心,根据检索树和哈希表找到多个聚类中心所对应的图片并构成候选集,采用浮点向量计算候选集中与待匹配特征向量的距离最近的图片。2.根据权利要求1所述的一种图像特征点匹配方法,其特征在于:所述向量入库的具体方法为:将入库特征向量分割成不相交的P个部分;在每个部分内部进行聚类中心个数为k1的k-means聚类;针对每个聚类中心,将所有分配到该聚类中心的数据做向量量化,聚类中心个数为k2;用P个哈希表分别记录映射到对应聚类中心的所有特征的ID或对应图片的名称。3.根据权利要求2所述的一种图像特征点匹配方法,其特征在于:所述向量匹配的具体方法为:将待匹配特征向量分割成不相交的P个部分;在每个部分内部...

【专利技术属性】
技术研发人员:段翰聪赵子天谭春强文慧闵革勇陈超李博洋
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1