一种基于聚类的距离方向直方图的图像检索方法技术

技术编号：12431468 阅读：66 留言：0更新日期：2015-12-03 15:10

该发明专利技术公开了一种基于聚类的距离方向直方图的图像检索方法，属于模式识别与信息处理技术领域，涉及计算机视觉方面的海量图像检索。该方法统计训练图像集所提取的局部视觉特征的分布特性，将局部特征空间进行划分；通过目标图像局部特征的描述符和划分空间中心的距离，以及局部特征主方向和划分空间主方向之间的一致性将局部特征分配到距离最近的子区域中，进而生成图像全效表达；使用图像全效表达进行检索，能高效的完成对大规模图像的检索工作。通过大量的实验验证了本发明专利技术在使用较少计算量的情况下，有效的提高了图像检索的准确率，并在大规模图像集上获得了很好的可扩展性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于模式识别与信息处理
，涉及计算机视觉方面的海量图像检索。
技术介绍
随着互联网和数字摄影设备的普及和发展，互联网上的图像呈爆炸性增长。如何从海量图像数据中，快速高效地获取自己感兴趣的图像显得尤为重要，吸引着越来越多专家学者的注意。随着图像规模的增加，图像检索的难度也相应增加，不仅要求高的检索准确率和效率，也要求尽可能低的存储开销，同时需要确保图像检索系统的可扩展性。因此，大规模的图像数据和其内容的多样性增加了对具有高辨识度的紧凑图像表达的需要。为了获取高辨识度的图像表达，研究者提出了多种有效的算法。其中，融合了发展相对成熟的文件索引技术和计算机视觉技术的词袋模型是一种应用广泛的图像检索模型。目前多数前沿的大规模图像检索系统依赖于图像的词袋模型来实现系统的可扩展性。然而训练图像集规模增加到百万级别，词袋模型面临着索引存储和相似度计算开销巨大的问题。通过聚合图像中大量的局部特征，生成图像的全局表达可以获得更好的检索性能。基于此，为了获得更紧凑的图像特征，Jegou等人结合了词袋模型Fisher Kernel的思想，将局部特征进行聚合生成一个紧凑的全局描述符，也就是VLAD描述符。VLAD描述符是比Fisher Kernel特征描述更加简单的聚合特征描述符，其检索性能较词袋模型更好。然而，VLAD描述符在量化的过程中，局部描述符的量化误差有正有负，可能出现彼此抵消的情况。同时，VLAD描述符只用了局部特征的描述符信息，而忽略了其他有用线索，例如空间信息，进而影响其检索性能和可扩展性。大规模图像检...

【技术保护点】
本专利技术提出的一种基于聚类的距离方向直方图的图像检索方法，包括如下步骤：步骤1：首先提取训练图像集中各图像的SIFT特征；步骤2：对步骤1获得所有图像的局部特征进行聚类，获得局部特征的粗划分，对每个粗划分中的分量再进行聚类处理，获得局部特征的子划分；将步骤1获得的各局部特征的主方向划分为R个主方向区域，根据各局部特征的主方向将其划归入相应的主方向区域，使各区域中包含局部特征的数量相近；再根据主方向区域的划分方法来对局部特征的子划分进一步的划分为多个子区域；图像集中每幅图像的局部特征在同一个子区域的数目，组成该图像的全效表达，获得图像集中每幅图像的全效表达；步骤3：若要对图像进行检索，则根据步骤1相同的方法提取目标图像的局部特征，将目标图像的各局部特征量化到距离最近的步骤2获得的子区域；步骤4：统计每个子区域中目标图像的局部特征数目，组成目标图像的全效表达；步骤5：找到与目标图像的全效表达距离最近的图像，即为与目标图像最相似的图像。

【技术特征摘要】

【专利技术属性】
技术研发人员：董乐，张宁，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人