图像检索系统中的加速方法技术方案

技术编号:5357086 阅读:222 留言:0更新日期:2012-04-11 18:40
一种计算机信息处理技术领域的图像检索系统中的加速方法,通过对标准图像和待检索图像分别提取特征描述子并创建视觉码书,然后根据种子点集合创建随机kd树并对特征描述子进行分类,接着进行矢量化处理并对倒排索引进行优化,最后将待检索图像矢量在优化倒排索引中进行相似性搜索,实现图像检索系统的加速。本发明专利技术能够弥补现有技术中聚类过程计算量大和计算时间长的问题,优化倒排索引在保证检索准确率的情况下,提高了相似性搜索的实时性。

【技术实现步骤摘要】

本专利技术涉及的是一种计算机信息处理
的方法,具体是一种图像检索系统 中的加速方法。
技术介绍
随着Internet网络和数码采集设备的大规模普及,图像数据在人们的生活中得 到了广泛的应用。越来越多的商业活动、事务交易和信息表现中包含着大量的图像数据。在 大规模图像数据库中,如何按照需求有效地去组织和查找这些图像数据成为人们关注的热 点问题。图像检索技术是指根据查询图像内容信息或指定查询标准,在标准图像库中进行 搜索并查找出符合查询条件的相应图像。图像检索技术一般分为基于文本的图像检索技术 和基于内容的图像检索技术。基于文本的图像检索技术,目前应用比较普及,它沿用了传 统文本检索技术,回避了对图像低层特征元素的分析,从图像名称、图像尺寸、压缩类型、作 者、年代等方面描述图像,通过关键词的形式查询图像,或者根据等级目录的形式浏览查找 特定目录下的图像。基于内容的图像检索技术,在给定查询图像的前提下,从图像的颜色、 形状、纹理等全局特征以及局部不变特征等方面来描述图像,并通过对图像特征进行矢量 化处理,在标准图像库中进行相似性搜索进而查找出内容相似的图像。基于内容的图像检索技术,早期大多采用颜色、纹理、形状等全局特征进行相似性 搜索,但是由于这些特征对于光照、遮挡以及几何形变等不具有稳健性,因此逐渐被DOG、 MSER、Harris等局部不变特征检测方法所取代。目前基于内容的图像检索技术,一般通过 特征检测提取图像特征,创建特征描述子,然后对特征描述子聚类创建视觉码书,将图像矢 量化,最后将图像矢量在高维索引结构中进行相似性搜索,给出相关搜索结果。经对现有技术的文献检索发现,已有以下与“” 相关的技术。Andrew Zisserman等在专利"Object Retrieval” (美国专利号为US 2005/0225678A1,公开日期为2005年12月13日)中提供了用户在图像中自定义目标进行 检索的方法。其中在对特征描述子分类时使用了 K-Means聚类方法,在待检索图像矢量和 标准图像矢量之间相似性查询时使用了传统的倒排索引方法。在大规模图像库中对所有特 征描述子使用K-Means聚类方法分类时,由于标准图像库中存在海量特征描述子,聚类中 心数目多,且聚类需要经过多次迭代才能完成,从而造成了聚类过程计算时间长,计算量大 的问题。在标准图像矢量中使用传统倒排索引方法进行相似性查询时,由于标准图像矢量 维数高,达到十万维以上,同样造成了查询实时性差的问题。进一步检索发现,DavidNister等在专利“Scalable Object Recognition Using HierarchicalQuantization with a Vocabulary Tree”(美国专利号为:US7725484B2,公 开日期为2010年5月25日)中提供了一种码书树,在K-Means聚类方法的基础上引入了 分层的概念,与传统K-Means聚类方法相比,聚类过程计算时间有所缩短,但是由于标准图 像库中存在海量描述子,聚类过程的计算量同样很大,聚类时间过长,同时由于采用了分层的方法,属于同一类别的不同描述子往往会被划分到不同的类别当中,进而造成了量化性 能较差。在待检索图像矢量和标准图像矢量之间进行相似性查询同样使用了传统的倒排索 引方法,由于图像矢量的维数没有降低,且量化性能较差,从而造成了检索准确率较低,实 时性较差。
技术实现思路
本专利技术针对现有技术存在的上述不足,提供一种,通 过随机采样创建视觉码书以及根据标准图像矢量创建优化倒排索引得以实现,能够弥补现 有技术中聚类过程计算量大和计算时间长的问题,优化倒排索引在保证检索准确率的情况 下,提高了相似性搜索的实时性。本专利技术是通过以下技术方案实现的,本专利技术通过对标准图像和待检索图像分别提 取特征描述子并生成视觉码书,然后根据种子点集合创建随机kd树并对特征描述子进行 分类,然后通过矢量化处理对倒排索引进行优化,最后将待检索图像矢量在优化倒排索引 中进行相似性搜索,实现图像检索系统的加速。所述的对标准图像和待检索图像分别提取特征描述子是指对标准图像和待检索 图像先采用高斯差分算子(Different of Gaussian, DOG)进行特征点检测,然后将每个高 其J 差分算子通过尺度不变描述子(Scale Invariant Feature Transformation, SIFT)进行 描述。所述的通过尺度不变描述子进行描述包括离线处理和实时处理两个步骤,其中在离线处理中,对于标准图像库C = (I1, I2,…,In)中的图像Ii(i = 1,2,…, 吣,通过5頂1~描述子表示为式.=化1乂,_-0,其中x丨(/ = 1,2,···,巧)是图像Ii中的单个描 述子,维数为128维,η,是图像Ii中SIFT描述子的个数。标准图像库中全部SIFT描述子N集合表示为S= (X1, X2,…,XN),集合S中SIFT描述子的总数为权利要求1.一种,其特征在于,通过对标准图像和待检索图像分别 采用高斯差分算子进行特征点检测,然后将每个高斯差分算子通过尺度不变描述子进行描 述并创建视觉码书,然后根据种子点集合创建随机kd树并对特征描述子进行分类,接着进 行矢量化处理并对倒排索引进行优化,最后将待检索图像矢量在优化倒排索引中进行相似 性搜索,实现图像检索系统的加速。2.根据权利要求1所述的,其特征是,所述的通过尺度不 变描述子进行描述包括离线处理和实时处理两个步骤,其中在离线处理中,对于标准图像库C= (I1, I2,…,In)中的图像Ii,通过SIFT描述子表 示为式=(x丨乂,…乂‘),其中x丨(/ = 1,2,…,乂/ = !,2,···,%)是图像Ii中的单个描述子,维数 为128维,η,是图像Ii中SIFT描述子的个数,标准图像库中全部SIFT描述子集合表示为S= (X1, X2,…,XN),集合S中SIFT描述子的总数为在实时处理中,对于待检索图像Q,通过SIFT描述子T表示为T= (q1, q2,…,qm),其 中qk(k = 1,2,…,m)是图像Q中单个描述子,维数为128维,m是图像Q中SIFT描述子 的个数。3.根据权利要求1所述的,其特征是,所述的创建视觉 码书是指对标准图像库中的特征描述子进行随机采样并创建视觉码书,具体步骤为对 SIFT描述子集合S随机采样,提取部分SIFT描述子作为种子点集合D,D = (Yl,y2,…,yz), 其中集合D中种子点的数量为z,每个种子点为= 1,2,…,ζ);然后对SIFT描述子 集合S进行分类,种子点决定了将与其相似的SIFT描述子划分到种子点对应的类别 中,种子点的数量ζ即为类别的数量,种子点集合D为标准图像Ii量化需要的视觉码书。4.根据权利要求1所述的,其特征是,所述的创建随机kd 树是指通过自上而下的迭代过程,每次迭代都以每个节点在多个较大方差值对应的维数 中随机选择且节点的分割阈值在对应维数靠近中值的元素中随机选择为原则进行节点的 创建。5.根据权利要求1所述的,其特征是,所述的对特征描述 子进行分类是指根据节点阈值将种子点集合D中的每个种子点~划分到不同的空间,具 体步骤为使用单一最本文档来自技高网
...

【技术保护点】
一种图像检索系统中的加速方法,其特征在于,通过对标准图像和待检索图像分别采用高斯差分算子进行特征点检测,然后将每个高斯差分算子通过尺度不变描述子进行描述并创建视觉码书,然后根据种子点集合创建随机kd树并对特征描述子进行分类,接着进行矢量化处理并对倒排索引进行优化,最后将待检索图像矢量在优化倒排索引中进行相似性搜索,实现图像检索系统的加速。

【技术特征摘要】

【专利技术属性】
技术研发人员:冯德瀛杨杰杨程刘从新
申请(专利权)人:上海交通大学
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1