一种基于聚类的距离方向直方图的图像检索方法技术

技术编号:12431468 阅读:66 留言:0更新日期:2015-12-03 15:10
该发明专利技术公开了一种基于聚类的距离方向直方图的图像检索方法,属于模式识别与信息处理技术领域,涉及计算机视觉方面的海量图像检索。该方法统计训练图像集所提取的局部视觉特征的分布特性,将局部特征空间进行划分;通过目标图像局部特征的描述符和划分空间中心的距离,以及局部特征主方向和划分空间主方向之间的一致性将局部特征分配到距离最近的子区域中,进而生成图像全效表达;使用图像全效表达进行检索,能高效的完成对大规模图像的检索工作。通过大量的实验验证了本发明专利技术在使用较少计算量的情况下,有效的提高了图像检索的准确率,并在大规模图像集上获得了很好的可扩展性。

【技术实现步骤摘要】

本专利技术属于模式识别与信息处理
,涉及计算机视觉方面的海量图像检 索。
技术介绍
随着互联网和数字摄影设备的普及和发展,互联网上的图像呈爆炸性增长。如何 从海量图像数据中,快速高效地获取自己感兴趣的图像显得尤为重要,吸引着越来越多专 家学者的注意。随着图像规模的增加,图像检索的难度也相应增加,不仅要求高的检索准确 率和效率,也要求尽可能低的存储开销,同时需要确保图像检索系统的可扩展性。因此,大 规模的图像数据和其内容的多样性增加了对具有高辨识度的紧凑图像表达的需要。为了获 取高辨识度的图像表达,研究者提出了多种有效的算法。其中,融合了发展相对成熟的文件 索引技术和计算机视觉技术的词袋模型是一种应用广泛的图像检索模型。目前多数前沿的 大规模图像检索系统依赖于图像的词袋模型来实现系统的可扩展性。然而训练图像集规模 增加到百万级别,词袋模型面临着索引存储和相似度计算开销巨大的问题。通过聚合图像 中大量的局部特征,生成图像的全局表达可以获得更好的检索性能。基于此,为了获得更紧 凑的图像特征,Jegou等人结合了词袋模型Fisher Kernel的思想,将局部特征进行聚合生 成一个紧凑的全局描述符,也就是VLAD描述符。VLAD描述符是比Fisher Kernel特征描述 更加简单的聚合特征描述符,其检索性能较词袋模型更好。然而,VLAD描述符在量化的过 程中,局部描述符的量化误差有正有负,可能出现彼此抵消的情况。同时,VLAD描述符只用 了局部特征的描述符信息,而忽略了其他有用线索,例如空间信息,进而影响其检索性能和 可扩展性。 大规模图像检索的关键在于其可扩展性,在处理海量图像数据时仍能获得高检索 准确率并保存尽量低的索引存储开销。为了实现这个目标,本专利技术针对现有方法的不足,吸 取了计算机视觉理论和信息检索理论中的最新成果,研究了如何提取具有高辨识度和区分 度的图像紧凑表达,来实现高效的大规模图像检索。基于此,本专利技术提出了一种用于检索的 基于聚类的距离方向直方图。基于聚类的距离方向直方图利用整个图像集所提取的局部特 征描述符的全局特性和规律,计算图像中的局部特征描述符相对于整个图像集的特征描述 符的分布。这样的分布特性可以让图像相对于图像集中的其他图像具有高辨识度。同时通 过利用局部特征的主方向信息,进一步提高其检索性能,具有更好的可扩展性,适用于大规 模图像检索。
技术实现思路
本专利技术要解决海量图像的检索问题,特别是包含百万或百万以上图像的训练图像 集,由此在处理海量图像数据时,可以高效地检索出用户所感兴趣的图像。本专利技术的目的 在于提供一种具有良好的可扩展性,适用于大规模图像检索的图像表达方法。 为达到上述目的,本专利技术提出的一种基于聚类的距离方向直方图的图像检索方 法,包括如下步骤: 步骤1 :首先提取训练图像集中各图像的SIFT特征; 步骤2 :对步骤1获得所有图像的局部特征进行聚类,获得局部特征的粗划分,对 每个粗划分中的分量再进行聚类处理,获得局部特征的子划分;将步骤1获得的各局部特 征的主方向划分为R个主方向区域,根据各局部特征的主方向将其划归入相应的主方向区 域,使各区域中包含局部特征的数量相近;再根据主方向区域的划分方法来对局部特征的 子划分进一步的划分为多个子区域;图像集中每幅图像的局部特征在同一个子区域的数 目,组成该图像的全效表达,获得图像集中每幅图像的全效表达; 步骤3 :若要对图像进行检索,则根据步骤1相同的方法提取目标图像的局部特 征,将目标图像的各局部特征量化到距离最近的步骤2获得的子区域; 步骤4 :统计每个子区域中目标图像的局部特征数目,组成目标图像的全效表达; 步骤5 :找到与目标图像的全效表达距离最近的图像,即为与目标图像最相似的 图像。 进一步的,所述步骤2中采用κ-means方法对局部特征进行聚类处理。 进一步的,所述步骤2中获得图像的全效表达后,再采用内标准化方法,对图像全 效表达进行标准化;所述步骤4获得目标图像的全效表达后,采用相同的内标准化方法进 行内标准化,所述步骤5计算内标准化后的全效表达之间的距离。 进一步的,将步骤2获得的内标准化后的图像全效表达划分成K个子向量,并对每 个子向量单独编码并存储;之后根据基于乘积量化器的近似最近邻搜索算法对图像全效表 达建立索引,以及计算目标图像与图像集中图像的相似度。 本专利技术的有益效果: 本专利技术通过提取图像集中局部特征的分布信息,将图像局部特征很好地聚合为一 个紧凑的全局描述,解决了大规模图像的检索问题,本专利技术具有以下优点和有益效果: 1.采用层级K-means算法,快速实现对图像集局部特征空间的划分。 2.在对图像集特征空间的划分中,不仅考虑了局部特征描述符,而且考虑了局部 特征主方向信息,实现了对图像集局部特征空间更细致的划分。 3.通过利用图像集局部特征全局特性和规律,将图像大量的局部特征聚合成一个 紧凑的全局特征,能有效的减少特征的存储空间,提高检索准确率,获得更好的可扩展性。【附图说明】 图I VLAD和DOHC描述符在不同数目的干扰图像下的大规模图像检索性能图; 图2 DOHC和VLAD描述符在Ukbench图像集上的平均准确率MAP (%); 图3 DOHC和VLAD描述符在Holidays图像集上的平均准确率MAP (%); 图4 DOHC和VLAD描述符在0xford5k Building图像集上的平均准确率MAP(%); 图5 DOHC和VLAD描述符在Paris6k图像集上的平均准确率MAP (%); 图6 DOHC和VLAD描述符的大规模图像检索性能对比。【具体实施方式】 为了使得本专利技术的目的、技术方案和有益效果更加清楚明白,以下结合具体案例, 并参照附图,对本专利技术进行进一步详细的说明。 本专利技术是用于大规模图像检索,特别是百万或百万以上图像的检索,图像全效表 达方法。该方法统计训练图像集所提取的局部视觉特征的分布特性,将局部特征空间进行 划分。通过目标图像局部特征的描述符和划分空间中心的距离,以及局部特征主方向和划 分空间主方向之间的一致性将局部特征分配到距离最近的子区域中,进而生成图像全效表 达。使用图像全效表达进行检索,能高效的完成对大规模图像的检索工作。通过大量的实 验验证了本专利技术在使用较少计算量的情况下,有效的提高了图像检索的准确率,并在大规 模图像集上获得了很好的可扩展性。 本专利技术提出的用于大规模训练图像集中相似图像检索的图像全效表达包括如下 步骤: 步骤1 :为了提取出图像的视觉信息,首先利用已有的局部特征提取算法提取图 像的局部特征。本专利技术采用的是经典的SIFT特征,提取出训练图像集和目标图像的SIFT 特征。每幅图像根据所提取的SIFT特征表示为I =比,f2,…,fM] e Rdxm,其中每个SIFT 特征A包括描述符d i,坐标U1,主方向Θ i和特征尺度s 1<3 步骤2 :对步骤1所获得的图像集的局部特征,采用层次K-means对其进行聚类。 我们利用K-means算法首先将图像集的SIFT特征描述符进行聚类,获得K个聚类C = 。其中K的取值设定为较少的整数值。本专利技术中,K的值设置为2的指数,从 8到128。然后,对获得的每个聚类本文档来自技高网
...

【技术保护点】
本专利技术提出的一种基于聚类的距离方向直方图的图像检索方法,包括如下步骤:步骤1:首先提取训练图像集中各图像的SIFT特征;步骤2:对步骤1获得所有图像的局部特征进行聚类,获得局部特征的粗划分,对每个粗划分中的分量再进行聚类处理,获得局部特征的子划分;将步骤1获得的各局部特征的主方向划分为R个主方向区域,根据各局部特征的主方向将其划归入相应的主方向区域,使各区域中包含局部特征的数量相近;再根据主方向区域的划分方法来对局部特征的子划分进一步的划分为多个子区域;图像集中每幅图像的局部特征在同一个子区域的数目,组成该图像的全效表达,获得图像集中每幅图像的全效表达;步骤3:若要对图像进行检索,则根据步骤1相同的方法提取目标图像的局部特征,将目标图像的各局部特征量化到距离最近的步骤2获得的子区域;步骤4:统计每个子区域中目标图像的局部特征数目,组成目标图像的全效表达;步骤5:找到与目标图像的全效表达距离最近的图像,即为与目标图像最相似的图像。

【技术特征摘要】

【专利技术属性】
技术研发人员:董乐张宁
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1