一种基于改进BOW算法的相似图片搜索方法技术

技术编号:13508624 阅读:88 留言:0更新日期:2016-08-10 20:00
本发明专利技术涉及一种基于改进BOW算法的相似图片搜索方法,大规模图片库中相似图片的快速和准确的搜索一直是互联网图像处理领域一个非常重要的研究方向,本发明专利技术给定一张图片,在线实时在海量图片集中搜索与其相似或含有相同主要物体或区域的图片。现有的方法一方面实时性比较低,另一方面准确率也很难得到保证。在图片库中图片存在旋转、尺度拉伸等变化的情况下很难实现。本发明专利技术可以在图片存在旋转、尺度变化的情况下实现相似图片的检索,并且可以保证检索的实时性和准确率,这也为本发明专利技术的实践应用提供了理论基础。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及一种基于改进BOW算法的相似图片搜索方法,大规模图片库中相似图片的快速和准确的搜索一直是互联网图像处理领域一个非常重要的研究方向,本专利技术给定一张图片,在线实时在海量图片集中搜索与其相似或含有相同主要物体或区域的图片。现有的方法一方面实时性比较低,另一方面准确率也很难得到保证。在图片库中图片存在旋转、尺度拉伸等变化的情况下很难实现。本专利技术可以在图片存在旋转、尺度变化的情况下实现相似图片的检索,并且可以保证检索的实时性和准确率,这也为本专利技术的实践应用提供了理论基础。【专利说明】一种基于改进BOW算法的相似图片搜索方法
本专利技术涉及数字图像处理和检索算法
,具体涉及一种基于改进BOW算法 的相似图片搜索方法,
技术介绍
大规模图片集中相似图片的检索是现今计算机视觉领域一个非常重要的研究方 向。其主要需要解决的问题是给定一张图片,在图片集中在线搜索与其外观相似或含有相 同主要物体或区域的图片。该研究方向在现实中已经有了一些相关的应用,比如,百度推出 的以图识图和淘宝根据图片搜索商品的应用。该问题的难点在于:实时性和准确率的要求 比较高;快速判别图像相似性的算法。 近年来大规模图片库中相似图片的搜索研究已经取得了一定的成果,其中最经典 的就是J.Philbin等人提出的Bag of Visual Words算法(BOW)(参考文献J.philbin, 0·Chum,M·I sard,J·Si vie,and A .Zisserman.Object retrieval with large vocabularies and fast spatial matching. In (^?1?,2007.809,810,812,814),该算法首 先对图片集中的每一张图片提取一定数量的SIFT点,对所有图片中的SIFT进行k-means聚 类,根据得到的聚类中心,将每张图片中的SIFT点量化到最近邻的聚类中心处,这样,每张 图片就可以使用一个高维向量表示。而两张图片的相似性度量标准就是表示这两张图片的 向量的相似性。该算法是目前使用最为广泛的相似图片检索算法,经过近几年的使用证明 了该方法的实用性,并且在实际系统中已经有所应用。此后,根据BOW算法的思想,一些研究 对BOV算法进行了改进:Divid Nister和Henrik Arewenius等人(参考文献David Nister and Henrik Stewenius. Scalable Recognition with a Vocabulary Tree. In CVPR,2006)在SIFT点聚类算法部分提出了 一种分层的聚类算法(HKM)来取代原有的k-means聚类算法,该改进的主要目的在于提高聚类的速度,但该方法会在一定程度上降低聚 类的精度,如果将聚类算法在线下进行,则应该以准确率作为最重要指标;Zhong Wu(参考 文南犬Zhong Wu,Qifa Ke1Jian Sun,Heung-Yeung Shum.A multi-Sample,Multi-Tree Approach to Bag-〇f-ffords Image Representation for Image Retrieval. In ICCV, 2009)等人提出了一种采用多棵聚类树进行SIFT点的聚类表示,并将每个SIFT点量化到多 棵树的相应聚类中心的方法,但该算法在量化时存在过分依赖于阈值的问题,导致实际结 果在阈值不同时差距很大。Christoph H.Lampert等人(参考文献 Christoph H.Lampert,Matthew B.Blaschko,and Thomas Hofmann.Beyond Sliding Windows:Object Localization by Efficient Subwindow Search. In CVPR 2008)在考虑图片中相似物体 的检测时引入了滑动窗口的方法,该方法可以在一定程度上提高检测的准确率,但由于该 方法在每幅图片中需要提取大量窗口导致时间复杂度比高,在给定一张图片检索与其相似 的图片时很难达到实时;另外一些研究主要考虑到提到的SIFT点的空间信息:Xiaoyu Wang 和Ming Yang(参考文南犬Xiaoyu Wang,Ming Yang,Timothee Cour,Shenghuo Zhu,Kai Yu,and Tony X.Han. Contextual Weighting for Vocabulary Tree based Image Retrieval. In ICCV,2011)等人指出在两幅图片中的SIFT点匹配时考虑该点周围一定半径 内点的尺度和角度信息;Svetlana Lazebnik等人(参考文献 Svetlana Lazebnik, Cordelia Schmid,Jean Ponce.Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories · In CVPR,2006)提出了一种经典的空间金 字塔算法(SPM),该算法考虑到图片中SIFT的位置排布,将图片分割成不同尺度的图像块, 对每一层中的每一图像块分别进行匹配,但该算法的效果主要体现在场景分类上,对相同 物体和区域的检索能力有限;另外一种考虑空间信息的算法是BOW算法(参考文献 Yimeng Zhang,Zhaoyin Jia,Tsuhan Chen. Image Retrieval with Geometry-Preserving Visual Phrases. In CVPR,2011):该算法认为只有量化后SIFT点所属类别相同并且位置关 系相同的点才属于匹配上点的点。
技术实现思路
本专利技术要解决技术问题为:克服现有技术的不足,提供一种基于改进BOW算法的相 似图片搜索方法,在经典的BOW算法的基础之上通过考虑匹配SIFT点之间的较强的位置关 系去除不满足几何关系的匹配点,并通过定义一个新的计算公式对相似度进行衡量,并提 高了该算法的准确率。该方法具有旋转和尺度不变性,因此对于图片中物体的形变更加鲁 邦,可以在一定程度上提高检索的准确率。 本专利技术解决上述技术问题采用的技术方案为:一种基于改进BOW算法的相似图片 搜索方法,在经典bag of words算法的基础上考虑匹配点之间的几何关系,去除不满足几 何关系的匹配点,并在相似度量函数中体现出来,从而提高了检索的准确率,具体实现步骤 如下: 步骤(1)、对大规模图片库中的每张图片进行SIFT特征点的提取,并记录各自的位 置坐标。 步骤(2)、对步骤(1)得到的SIFT点进行k-means聚类,得到一定数量的聚类中心, 即字典。 步骤(3 )、将图片库中每张图片中提取到的SIFT点量化到步骤(2)中的聚类中心, 以字典中的单词(即聚类中心)为索引,记录包含该单词的图片和该SIFT点的位置坐标,即 生成一个Inverted file。 步骤(4)、对于待检索图片提取该图片中的SIFT点,并且根据步骤(本文档来自技高网
...

【技术保护点】
一种基于改进BOW算法的相似图片搜索方法,其特征在于:该方法包括如下步骤:步骤(1)、对大规模图片库中的每张图片进行SIFT特征点的提取,并记录各自的位置坐标;步骤(2)、对步骤(1)得到的SIFT点进行k‑means聚类,得到一定数量的聚类中心,即字典,聚类中心的数量由图片集和提取到的SIFT点的数量确定,使用改进的k‑means算法AKM算法,以牺牲少量计算精度的代价极大的提高了计算的速度;步骤(3)、将图片库中每张图片中提取到的SIFT点量化到步骤(2)中的聚类中心,这里为了提高速度,使用近似最近邻的聚类算法,在保证精度的情况下极大地提高量化的速度,这样每张图片可以使用一个由量化结果组成的高维向量表示,以字典中的单词即聚类中心为索引,记录包含该单词的图片和该SIFT点的位置坐标,即生成一个Inverted File;步骤(4)、对于待检索图片提取该章图片中的SIFT点,并且根据步骤(2)中的聚类中心进行量化,这样待检索图片也使用一个高维的向量进行表示;步骤(5)、对待检索图片和图片库中的图片计算属于同一类别的SIFT点即量化到同一个聚类中心的SIFT点的数量;步骤(6)、对于属于同一类别的SIFT点取任意的三点进行组合,并计算这两张图片中的三点组成的三角形的相似性,对于满足一定阈值的这三个SIFT点,在度量函数中加上相应的得分,否则不计分;步骤(7)、对最后的得分进行排序,得分越高表示待检索图片和图片库的该张图片越相似,并返回结果。...

【技术特征摘要】

【专利技术属性】
技术研发人员:凌强赵敏达李峰
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1