当前位置: 首页 > 专利查询>北京大学专利>正文

基于视觉词语空间共生性的图像检索方法技术

技术编号:8022417 阅读:272 留言:0更新日期:2012-11-29 04:39
本发明专利技术提供一种基于视觉词语空间共生性的图像检索方法,其步骤包括:统计训练数据库中任意两个视觉词语之间共生的概率,构建视觉词语共生表;提取输入的查询图像的尺度不变特征;在尺度不变特征中随机选择部分特征作为中心特征,对中心特征做精确映射;并在中心特征的仿射不变区域内统计其近邻特征;根据视觉词语共生表和精确映射的结果,利用高阶概率预测器为近邻特征预测候选视觉词语;比较候选词语与尺度不变特征之间的距离,确定最优的视觉词语,进而进行图像检索。本发明专利技术利用了视觉词语之间的共生性,能够更加有效、快速的产生视觉词语和进行图像检索。

【技术实现步骤摘要】

本专利技术属于图像检索与高维数据搜索
,涉及基于字袋模型的图像检索技术,具体涉及一种利用视觉词语空间共生性的图像检索方法。
技术介绍
基于内容的图像检索系统中,图像被表示成尺度不变的局部特征的集合。通过将数据库中图像特征聚类与量化,可以得到视觉字典。则任意一幅新的图像的特征,都可以根据这本视觉字典映射到相应的视觉词语,图像被表示为一袋视觉词语,这就是字袋模型的产生。其中如何将图像特征映射到相应的视觉词语也即是所谓的视觉词语产生阶段,是字袋模型的重要环节,其时间与精度直接决定了字袋模型的检索效率与效果。 作为一种经典算法,树形搜索算法被广泛应用于图像检索的视觉词语产生阶段。通过多叉树的索引,视觉词语的产生理论上最快可以在O(Iog2N)的时间内完成,N是视觉词典大小。代表算法包括KD树和K均值树。KD树是在近似最近邻查找问题中应用最广泛的算法之一,它是一种由二叉搜索树推广而来的多维数据结构,其中每个结点为一个K维向量,它通过超平面把结点空间递归的划分为两个子空间来实现二叉搜索。在K维空间中,对N个点中查找最近邻,蛮力算法的时间复杂度为0(N2),KD树的最大时间复杂度,当N个点是随机分布时,甚至可以将搜索的复杂度降到O(Iog2N)。然而,KD树是局部优化算法,其搜索直接返回的结果并不一定是最近邻点,还需要对其相邻区域进行回溯比较,以确定最终的最近邻点。随着数据维度的增长,基于KD树的搜索需要的回溯比较次数将呈指数型增长,导致KD树的性能越来越差,当维度增长到一定程度,比如0(d>log2N)时,回溯需要消耗的时间太多,以至于KD树的检索效率并不比蛮力算法的优越。为了解决这个问题,研究人员又提出了一系列近似最近邻算法。下面分别介绍KD树与K均值树。I.基于KD树的搜索算法Arya 等人(S. Arya, D. M. Mount, N. S. Netanyahu, R. Silverman, and A. Y. ffu. Anoptimal algorithm for approximate nearest neighbor searching fixed dimensions.Journal of the ACM(JACM),45 (6) :891_923,1998.)釆用优先队列的方法来加速搜索的剪枝过程,提高搜索效率;Beis 和 Lowe (J. S. Be is,D. G. Lowe. Shape indexing usingapproximate nearest neighbor search in high-dimensional spaces. In Proc.CVPRj pages 1000 - 1006,1997.)提出一种相似的近似搜索方法〃Best Bin First〃。与 Arya不同之处在于,它们将检索的停止条件改为检测叶子节点数是否达到某一阈值,如果是则停止搜索;SiIpa-Anan 和 Hartley (C. Silpa-Ananj R. Hartley. Optimised kd-trees forfast image descriptor matching. In Proc. CVPRj pages 1-8,2008.)改进了原来的KD树算法,它们建立多棵KD树并且利用它们同时进行搜索来获得检索性能的提高。2.基于K均值树的搜索算法作为K均值树的一种变形,球形树(Metric Tree)是一种点集的分层表示结构,树的节点是多维空间的超球面,每个非叶子节点包含多个子节点,并以中心和半径来表示。中心是子叶子结点的算术平均,半径是由中心到最远结点的距离;对球形树的结构进行改进,使其左右子树存在重合区域的树称为spill-tree (T. Liu, A. ff. Moore, A. Gray, K.Yang. An investigation of practical approximate nearest neighbor algorithms.In Proc. NIPS, pages 825 - 832,2004.),这种树在搜索树剪枝上有提高,因为重叠部分的存在,降低了因为误剪枝导致的错误,但也因此降低了树缩减效率;Gray等人(A.Gray and A. ff. Moore.N-Body Problems in Statistical Learning. In T.K.Leen, T.G. Dietterich, and V. Tresp, editors, Advances in Neural Information ProcessingSystems 13 (December 2000). MIT Press, 2001.)提出〃dual tree〃算法,其思想是对目标数据集和查询数据集分别建立有序索引树,同时遍历两棵树来进行剪枝判断和比较。该方法的好处在于利用查询数据特征空间的相关信息,将相近的特征放在一起,在搜索的过程中对相近的特征进行共同剪枝,减少了比较次数,进而实现搜索过程的加速;Nister(D.Nister, H. Stewenius. Scalable recognition with a vocabulary tree. In Proc.CVPR, pages 2161-2168, 2006.)等人提出一种分级索引的K均值树(hierarchical K-meanstree)。Muja (M. Muja, D. G. Lowe. Fast approximate nearest neighbors with automaticalgorithm configuration . In Proc. VISSAPP, pages 331 - 340,2009.)于 2009 年提出FLANN (Fast Liberary for Approximate Nearest Neighbor)的最近邻查询方法,该方法 可以根据数据集合的分布特点、对映射精度和空间资源消耗的要求来推荐索引类型和检索参数,在高维空间最近邻查找领域得到广泛的使用。在本专利技术中,将采用FLANN作为直接映射的初步映射和间接映射的基准。FLANN主要包括两类索引结构基于KD树的变形随机KD森林和K均值树。KD树和K均值树本质上都属于局部搜索的算法,从其根节点直接单次下降到叶子节点所得到的映射结果通常局部性太强,误差太大(对牛津建筑物数据库中所有特征进行基于KD树的不回溯搜索,所得精度仅为0. 05),为了获取更高的映射精度,需要对查询特征进行大量的回溯工作。在FLANN中这两种数据结构的回溯过程都是基于Best Bin First算法的,其核心思想是以节点和被查询节点距离递增的顺序来搜索节点,在索引的过程中,利用一个优先队列记录被删减掉的节点(即未搜索的节点)以及与查询节点的可能的最近距离,并且按照距离从小到大的顺序排列,在回溯的过程中,优先队列每次首先弹出未搜索节点中与查询节点最近的那个,这样一方面保证可以尽快的找到最近的节点,另一方面通过判断避免多余的比较运算,在保证算法精度的同时,提高了算法的效率。此外,在高维数据K近邻问题中,局部敏感哈希(LSH)因为其运本文档来自技高网...

【技术保护点】
一种基于视觉词语空间共生性的图像检索方法,包括下列步骤:1)统计训练数据库中任意两个视觉词语之间共生的概率,构建视觉词语共生表;2)提取输入的查询图像的尺度不变特征;3)在所述尺度不变特征中随机选择部分特征作为中心特征,对所述中心特征做精确映射;并在所述中心特征的仿射不变区域内统计其近邻特征;4)根据所述视觉词语共生表和所述精确映射的结果,利用高阶概率预测器为所述近邻特征预测候选视觉词语;5)比较所述候选视觉词语与所述尺度不变特征之间的距离,确定最优的视觉词语;6)根据所述最优的视觉词语,对所述查询图像进行检索,并返回相关图像。

【技术特征摘要】

【专利技术属性】
技术研发人员:史淼晶徐蕊鑫许超
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1