一种近似重复图像检测方法技术

技术编号:9695023 阅读:105 留言:0更新日期:2014-02-21 01:40
本发明专利技术公开了一种近似重复图像检测方法,该方法包括以下步骤:获取训练图像集,并根据所述训练图像集中的图像学习得到多视觉词汇库;基于学习得到的多视觉词汇库,使用非负稀疏编码方法将待检测图像和图像数据库中图像的局部特征编码成非负的稀疏向量;通过所述非负稀疏向量的区域融合和空间结合而获取待检测图像和图像数据库中图像的直方图向量;根据所述待检测图像和图像数据库中图像的直方图向量度量图像之间的相似性,并输出图像数据库中与待检测图像近似重复的图像。

【技术实现步骤摘要】
ー种近似重复图像检测方法
本专利技术涉及计算机视觉领域,特别涉及ー种近似重复图像检测(Near-duplicateImage Detection)技木。
技术介绍
随着多媒体技术和相关电子处理技术的快速发展,作为信息的一种有效传播方式,数字图像正经历快速发展的时期,互联网上的图像数量正在呈爆炸式增长,这就不可避免的存在了大量的近似重复图像,给信息存储和用户检索带来非常的不便。因此近似重复图像检测吸引了ー些学者的兴趣。通过近似重复图像检测的研究,一方面可以实现图像版权保护,另一方面,如果应用在图像搜索引擎中,用于过滤掉检索结果中的重复图像,从而提高用户的检索质量。因此,近似重复图像检测有非常重要的研究意义和应用价值。通常近似重复图像是由某幅源图像通过某些变换得到的,一般可以产生近似重复图像的变换包括平移、缩放、旋转、图像色调的变化、添加网址或商标、格式变化、分辨率变化等等。近似重复图像检测最常用的框架有以下两类:基于词包模型(Bag of Words)的方法和基于索引的方法。词包模型的框架主要包括提取表示图像视觉的局部特征,对局部特征量化或编码,然后通过编码融合形成最終的直方图向量来表示图像,最后度量图像直方图向量之间的相似性。基于索引的框架比较流行的是将提取的图像的特征通过哈希编码处理成ー个紧凑的显著的哈希串,这样相近的特征点以很高的概率被处理成相似的哈希串,在捜索的过程中,仅仅搜索那些相似的哈希串,从而降低了捜索的时间复杂度,但是最終的检测结果并不是很令人满意,同时它还需要大量的存储空间。因此,近年来,研究工作基本上是采用词包模型的框架来做近似重复图像检测。当前非常流行的词包模型框架不仅用在近似重复图像检测上,还用在图像检索、图像分类等其他应用上。词包模型最大的缺点就是没有考虑图像视觉特征的位置信息,而只是对一幅图像的视觉特征个数的统计信息。因此有ー些研究学者提出了词包模型结合空间金字塔匹配的方法,它在一定程度上考虑了图像视觉特征的位置信息,并获得了较好的实验結果。但是这种词包模型结合空间金字塔匹配的方法也存在如下缺点:1、对于空间金字塔的每一子块,都是基于同一个视觉词汇库来对特征编码,没有考虑视觉词汇库中视觉单词的空间位置信息;2、现流行特征编码方法会使最終融合的图像表示损失太多的图像视觉信息;3、相似性度量函数不够鲁棒,不能准确的度量图像之间的差异性。
技术实现思路
(一 )要解决的技术问题本专利技术的目的g在提出一种适用于复杂变换下的近似重复图像检测方法,解决准确快速的检测近似重复图像的技术问题。( ニ )技术方案为实现上述目的,本专利技术提出ー种近似重复图像检测方法,该方法包括以下步骤:步骤1:获取训练图像集,并根据所述训练图像集中的图像学习得到多视觉词汇库;步骤2:基于学习得到的多视觉词汇库,使用非负稀疏编码方法将待检测图像和图像数据库中图像的局部特征编码成非负的稀疏向量;步骤3:通过所述非负稀疏向量的区域融合和空间结合而获取待检测图像和图像数据库中图像的直方图向量;步骤4:根据所述待检测图像和图像数据库中图像的直方图向量计算图像之间的相似性,并输出图像数据库中与待检测图像近似重复的图像。本专利技术还提出一种近似重复图像检测装置,该装置包括:多视觉词汇库获取模块,用于获取训练图像集,并根据所述训练图像集中的图像学习得到多视觉词汇库;稀疏向量生成模块,用于基于学习得到的多视觉词汇库,使用非负稀疏编码方法将待检测图像和图像数据库中图像的局部特征编码成非负的稀疏向量;直方图向量生成模块,用于通过所述非负稀疏向量的区域融合和空间结合而获取待检测图像和图像数据库中图像的直方图向量;输出模块,其根据所述待检测图像和图像数据库中图像的直方图向量计算图像之间的相似性,并输出图像数据库中与待检测图像近似重复的图像。(三)有益效果本专利技术所提出的有效的近似重复图像检测方法,采用了词包模型和空间金字塔匹配相结合的框架,提出的学习多个独立的视觉词汇库,在一定程度上考虑了视觉单词的空间位置信息。采用的对视觉特征非负稀疏编码方法,能够更好的对相近的特征给予相似的编码,最后设计出的加权卡方函数能够准确的度量两幅图像之间的相似性。通过将以上提出的方法相结合,获得非常好的近似重复图像检测结果。【附图说明】图1是本专利技术的近似重复图像检测方法的流程图;图2是本专利技术的提出的多个独立的视觉词汇库。【具体实施方式】为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术作进一步的详细说明。本专利技术的方法具体运行的硬件和编程语言并不受限制,用任何语言编写都可以实现本专利技术的方法。本专利技术采用一台具有1.86G赫兹中央处理器和32G字节内存的计算机,并用Matlab语言编制了近似重复图像检测的工作程序,实现了本专利技术的方法。图1是本专利技术提出的有效的近似重复图像检测方法的流程图。如图1所示,该方法包括:步骤1:获取训练图像集,并从训练图像集中学习多个独立的视觉词汇库;步骤2:对待检测图像和图像数据库中的每幅图像,均提取图像局部特征,基于步骤I学习到的多视觉词汇库,使用非负稀疏编码方法对图像的局部特征编码成非负的稀疏向量;步骤3:通过有效的非负稀疏向量的区域最大值融合和空间结合而获取用于表示图像的直方图向量;步骤4:设计相似性度量函数,根据所述待检测图像的直方图向量和图像数据库中图像的直方图向量度量待检测图像和图像数据库中图像之间的相似性,并输出图像数据库中与待检测图像近似重复的图像。下面详细给出本专利技术技术方案中所涉及的各个步骤。对于步骤I,包括如下步骤:步骤Ia:获取一部分已有图像作为训练图像集,对训练图像预处理,使得图像像素大小不超过500X500。对训练图像集中的每幅图像提取表示图像视觉的局部特征SIFT (Scale Invariant Feature Transform)描述子;步骤Ib:对每一幅训练图像构建空间金字塔,对于空间金字塔的每ー块,把所有训练图像集中对应该块的SIFT特征集集中在一起,使用Kmeans聚类方法学习出ー个独立的视觉词汇库,这样就学习出了和空间金字塔对应的多个独立的视觉词汇库,该多个独立的视觉词汇库构成多视觉词汇库。关于构建图像空间的模型,本专利技术实施例中选择两层的空间金字塔,具体如图2所示。设置层数L = 2,即O、I层,每层分为Z1XZ1子块,因此空间金字塔总共的划分子块为本文档来自技高网
...

【技术保护点】
一种近似重复图像检测方法,该方法包括以下步骤:步骤1:获取训练图像集,并根据所述训练图像集中的图像学习得到多视觉词汇库;步骤2:基于学习得到的多视觉词汇库,使用非负稀疏编码方法将待检测图像和图像数据库中图像的局部特征编码成非负的稀疏向量;步骤3:通过所述非负稀疏向量的区域融合和空间结合而获取待检测图像和图像数据库中图像的直方图向量;步骤4:根据所述待检测图像和图像数据库中图像的直方图向量计算图像之间的相似性,并输出图像数据库中与待检测图像近似重复的图像。

【技术特征摘要】
1.ー种近似重复图像检测方法,该方法包括以下步骤: 步骤1:获取训练图像集,井根据所述训练图像集中的图像学习得到多视觉词汇库; 步骤2:基于学习得到的多视觉词汇库,使用非负稀疏编码方法将待检测图像和图像数据库中图像的局部特征编码成非负的稀疏向量; 步骤3:通过所述非负稀疏向量的区域融合和空间结合而获取待检测图像和图像数据库中图像的直方图向量; 步骤4:根据所述待检测图像和图像数据库中图像的直方图向量计算图像之间的相似性,并输出图像数据库中与待检测图像近似重复的图像。2.根据权利要求1所述的方法,其特征在于,所述步骤I包括: 步骤11:获取一部分已有图像作为训练图像集,并对其中的训练图像进行预处理,使得训练图像像素大小不超过预定值,对预处理后的训练图像集中的每幅图像提取表示图像视觉的局部特征SIFT描述子; 步骤12:对训练集中的图像构建图像空间金字塔,对于图像空间金字塔的每ー块,把所有训练图像集中对应该块的SIFT特征集集中在一起,学习得到对应于图像空间金字塔每ー块的独立视觉词汇库,对应所述图像空间金字塔所有块的独立视觉词汇库构成了多视觉词汇库。3.根据权利要求2所述的方法,其特征在于,所述步骤2包括: 步骤21、对待检测图像和图像数据库中的所有图像预处理,使得图像像素大小不超过预定值,提取预处理后图像的表示图像视觉的局部特征SIFT描述子;· 步骤22:对待检测图像和图像数据库中每幅图像,构建图像空间金字塔,对于图像空间金字塔中每ー块,根据对应于该块的独立视觉词汇库,使用非负稀疏编码方法将待检测图像和图像数据库中每幅图像对应该块的所有SIFT描述子编码成稀疏向量。4.如权利要求3所述的方...

【专利技术属性】
技术研发人员:胡卫明周闪兴军亮
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1