用于查找最近邻的方法和设备技术

技术编号:9360508 阅读:97 留言:0更新日期:2013-11-21 06:13
本发明专利技术涉及一种用于查找最近邻的方法和设备。更特别地,本方法涉及对诸如矢量的多维数据进行分类、搜索和匹配以查找最近邻。所述方法作为SIFT的一部分尤其有用。

【技术实现步骤摘要】
【国外来华专利技术】用于查找最近邻的方法和设备
本专利技术涉及一种用于查找最近邻的方法和装置。更特别地,本专利技术涉及多维数据(例如,矢量)的分类、搜索和匹配以查找最近邻。该方法作为尺度不变特征转换(SIFT)算法的一部分尤其有用。
技术介绍
美国专利6711293B1的专利技术人罗尔(Lowe)利用了被认为是最优柱优先(Best-bin-first)搜索的k维树算法(k-dtreealgorithm)的修正,最优柱优先搜索算法能够只利用有限量的计算以很大的概率识别最近邻。US2010/0067745公开了一种用于视频中的对象收集和识别的方法。尤其是,它涉及人脸图像的识别。该方法利用了很可能与同一人相关联的视频对象的集群。如果新图像到现有集群的距离小于预定的第一阈值距离,则该新图像被视为属于该集群。如果新图像到该集群的距离大于第二阈值距离(该第二阈值距离小于该第一阈值距离),则该新图像成为该集群的一部分。Ye,L.等人的“AutocannibalisticandAnyspaceIndexingAlgorithmswithApplicationstoSensorDataMining”,加利福尼亚大学计算机科学与工程系,Riverside,US,85-96,提供了变化的Orchard算法(Orchardalgorithm)。在此,牺牲了速度以减少对内存的需求。这一设计仔细推敲了牺牲多少速度以节约内存。然而,无论再怎样的情况下,该算法都要求了空间的最小值。在Orchard算法中,对于数据集的每项都计算出其近邻的分类表。对较大的数据集,这就需要大量的内存。在变化的Orchard算法中,相互接近的项与项的行被删除以节约空间。因此,搜索算法牺牲了速度以换取存储空间。Ye等人.进一步提出了动态的内存分配以对算法进行优化。VidalRuiz,E.,“Analgorithmforfindingnearestneighboursin(approximately)constantaveragetime”,PatternRecognitionLetters4(1986),145-157,涉及以近似恒定的平均时间复杂度(例如,与数据集的规模无关)查找给定样本的最近邻的算法。
技术实现思路
最近邻的搜索问题(最近邻搜索,也被认为是接近度搜索、相似度搜索或最近点搜索)出现在众多应用领域当中,包括,但并不仅限于:模式识别(尤其用于光学特性识别);统计分类(k最近邻算法);计算机视觉;数据库中基于内容的图像检索;编码理论;数据压缩;推荐系统;网络销售;DNA测序;拼写检查(建议正确的拼写);剽窃检测;用于预测职业运动员的职业道路的相似度分数;集群分析(将一组观察数据分配到子集,(例如,集群)以便相同集群里的观察数据在某种程度上是相似的,该分配通常基于欧氏距离(Euclideandistance));多元密度估计和模式分类;以及机器学习。本专利技术的专利技术人专利技术出允许更短的查找时间,并且更能够容易地适用于并行处理以允许另外缩短查找时间的方法。根据本专利技术的一个方面,本专利技术涉及一种在由多个矢量组成的数据集中对一特定矢量进行匹配的方法,该方法包括以下步骤:i.选择一参考点矢量;ii计算所述参考点矢量与所述数据集中的所述矢量之间的距离d;iii.将所述数据集中的所述矢量分类到不同的组中,所述每个组中的矢量与所述参考点矢量有相同距离dgroup;iv.随后将包括两个以上矢量的所述每个组进行重新排列,以便所述组中的第二矢量到所述组中的第一矢量有最小距离,并且所述组中每个后续的矢量到组中的前一个矢量都有最小距离;v.识别对于所述特定矢量的最佳匹配,通过:a.计算所述参考点矢量和所述特定矢量之间的距离dspecific;b.识别具有最接近于计算的所述距离dspecific的距离d的矢量的一个或多个组;c.在所识别的一个或多个组中识别具有与所述特定矢量最近的距离dminimum的一个或多个矢量;d.识别与所述参考点矢量距离为d的任一额外的组,所述距离d从所述参考点矢量开始并且在从零矢量和dspecific-dminimum中的较大的一个到dspecific+dminimum的区间上;以及e.重复步骤4.3和4.4直到在所述区间上的所有组都被验证过。本领域的技术人员将意识到,该方法同样适用于矩阵和张量。用于更佳的匹配的搜索适用于并行处理。本领域的技术人员将更进一步地意识到,该方法能够很容易地适用于查找第二佳的匹配、第三佳的匹配,等等。根据本专利技术的一个方面,本专利技术涉及一种在由多个矢量组成的数据集中对一特定矢量进行匹配的方法,其中,所述多个矢量表现出尺度不变特征;为了在至少一幅图像中识别尺度不变特征,所述方法包括:i.选择一参考点矢量;ii计算所述参考点矢量与所述数据集中的所述矢量之间的距离d;iii.将所述数据集中的所述矢量分类到不同的组中,所述每个矢量与所述参考点矢量有相同距离dgroup;iv.随后将包括两个以上矢量的所述每个组进行重新排列,以便所述组中的第二矢量到组中的第一矢量有最小距离,并且组中每个后续的矢量到所述组中的前一个矢量都有最小距离;v.识别对于所述特定矢量的最佳匹配,通过:a.计算所述参考点矢量和所述特定矢量之间的距离dspecific;b.识别具有最接近于计算的所述距离dspecific的距离d的矢量的一个或多个组;c.在所识别的一个或多个组中识别具有与所述特定矢量最接近的距离dminimum的一个或多个矢量;d.识别与所述参考点矢量距离为d的任一额外组,所述距离d从所述参考点矢量开始并且在从零矢量和dspecific-dminimum中的较大的一个到dspecific+dminimum的区间上;以及e.重复步骤4.3和4.4直到在所述区间上的所有组都被验证过。根据本专利技术的一个方面,本专利技术涉及一种在由多个矢量组成的数据集中对一特定矢量进行匹配的方法,所述方法包括:i.选择一参考点矢量;ii计算所述参考点矢量与所述数据集中的矢量之间的距离d;iii.将所述数据集中的所述矢量分类到不同的组中,所述每个组中的矢量与所述参考点矢量有相同距离dgroup;iv.随后将包括一个或者多个矢量的所述每个组进行重新排列,以便所述组中的第二矢量到所述组中的第一矢量有最小距离,并且组中每个后续的矢量到组中的前一个矢量都有最小距离;这一方面使随后的数据集中的特定矢量能够快速匹配。根据本专利技术的一个方面,本专利技术涉及一种在由多个矢量组成的数据集中对一特定矢量进行匹配的方法,所述多个矢量在至少一幅图像中表现出尺度不变特征;为了随后在至少一幅图像中识别尺度不变特征,所述方法包括以下步骤:i.选择一参考点矢量;ii计算所述参考点矢量与所述数据集中的矢量之间的距离d;iii.将所述数据集中的所述矢量分类到不同的组中,所述每个组中的矢量与参考点矢量有相同距离dgroup;iv.随后将包括一个或者多个矢量的所述每个组进行重新排列,以便所述组中的第二矢量到组中的第一矢量有最小距离,并且组中每个后续的矢量到组中的前一个矢量都有最小距离。根据本专利技术的一个方面,本专利技术涉及一种识别图像特征的方法,所述图像特征在由多个像素所定义的原始图像中的不同尺度上是稳定的,所述方法包括:i.通过对将不同的模糊度应用于所述原始图像本文档来自技高网
...
用于查找最近邻的方法和设备

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2010.12.17 DK PA201070560;2011.01.03 US 61/429,2681.一种将特定矢量在由多个矢量组成的数据集中进行匹配的方法,其中,所述矢量表现出尺度不变特征,以在至少一个图像中识别所述尺度不变特征,所述方法包括以下步骤:i.选择一参考点矢量,其中,所述参考点矢量在所述数据集中进行选择;ii.计算所述参考点矢量和所述数据集的每个矢量之间的距离d;iii.按照距所述参考点矢量的距离d递增的关系重新排列所述数据集的所述多个矢量;iv.将所述数据集中的所述矢量分类到不同的矢量组中,所述每个组中的所述矢量与所述参考点矢量有相同距离dgroup;v.随后将包括多于两个所述矢量的每个矢量组中的所述矢量进行重新排列,以便所述组中的第二矢量到所述组中的第一矢量有最小距离,并且所述组中每个后续的矢量到所述组中的前一个矢量都有最小距离;以及vi.通过以下步骤识别针对所述特定矢量的最佳匹配:a.计算所述参考点矢量和所述特定矢量之间的距离dspecific;b.将所述计算的距离dspecific与所述参考点矢量和定位在所述重新排列的多个矢量中间的矢量之间的距离进行比较;c.通过使用逐次近似法并且基于所述参考点矢量和定位在所述重新排列的多个矢量中间的矢量之间的距离,对具有如下矢量的矢量组进行识别:具有最接近于所述计算的距离dspecific的距离d的矢量;d.在所识别的一个或多个所述组中识别具有与所述特定矢量最接近的距离dminimum的一个或多个所述矢量;e.识别与所述参考点矢量距...

【专利技术属性】
技术研发人员:摩塔萨姆·彻海博尔
申请(专利权)人:伊维赛斯公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1