一种近似重复图像检测方法技术

技术编号：9695023 阅读：105 留言：0更新日期：2014-02-21 01:40

本发明专利技术公开了一种近似重复图像检测方法，该方法包括以下步骤：获取训练图像集，并根据所述训练图像集中的图像学习得到多视觉词汇库；基于学习得到的多视觉词汇库，使用非负稀疏编码方法将待检测图像和图像数据库中图像的局部特征编码成非负的稀疏向量；通过所述非负稀疏向量的区域融合和空间结合而获取待检测图像和图像数据库中图像的直方图向量；根据所述待检测图像和图像数据库中图像的直方图向量度量图像之间的相似性，并输出图像数据库中与待检测图像近似重复的图像。

全部详细技术资料下载

【技术实现步骤摘要】
ー种近似重复图像检测方法
本专利技术涉及计算机视觉领域,特别涉及ー种近似重复图像检测(Near-duplicateImage Detection)技木。
技术介绍
随着多媒体技术和相关电子处理技术的快速发展,作为信息的一种有效传播方式，数字图像正经历快速发展的时期，互联网上的图像数量正在呈爆炸式增长，这就不可避免的存在了大量的近似重复图像，给信息存储和用户检索带来非常的不便。因此近似重复图像检测吸引了ー些学者的兴趣。通过近似重复图像检测的研究，一方面可以实现图像版权保护，另一方面，如果应用在图像搜索引擎中，用于过滤掉检索结果中的重复图像，从而提高用户的检索质量。因此，近似重复图像检测有非常重要的研究意义和应用价值。通常近似重复图像是由某幅源图像通过某些变换得到的，一般可以产生近似重复图像的变换包括平移、缩放、旋转、图像色调的变化、添加网址或商标、格式变化、分辨率变化等等。近似重复图像检测最常用的框架有以下两类:基于词包模型(Bag of Words)的方法和基于索引的方法。词包模型的框架主要包括提取表示图像视觉的局部特征，对局部特征量化或编码，然后通过编码融合形成最終的直方图向量来表示图像，最后度量图像直方图向量之间的相似性。基于索引的框架比较流行的是将提取的图像的特征通过哈希编码处理成ー个紧凑的显著的哈希串，这样相近的特征点以很高的概率被处理成相似的哈希串，在捜索的过程中，仅仅搜索那些相似的哈希串，从而降低了捜索的时间复杂度，但是最終的检测结果并不是很令人满意，同时它还需要大量的存储空间。因此，近年来，研究工作基本上是采用词包模型的框架来做近似重...

【技术保护点】
一种近似重复图像检测方法，该方法包括以下步骤：步骤1：获取训练图像集，并根据所述训练图像集中的图像学习得到多视觉词汇库；步骤2：基于学习得到的多视觉词汇库，使用非负稀疏编码方法将待检测图像和图像数据库中图像的局部特征编码成非负的稀疏向量；步骤3：通过所述非负稀疏向量的区域融合和空间结合而获取待检测图像和图像数据库中图像的直方图向量；步骤4：根据所述待检测图像和图像数据库中图像的直方图向量计算图像之间的相似性，并输出图像数据库中与待检测图像近似重复的图像。

【技术特征摘要】
1.ー种近似重复图像检测方法，该方法包括以下步骤: 步骤1:获取训练图像集，井根据所述训练图像集中的图像学习得到多视觉词汇库；步骤2:基于学习得到的多视觉词汇库，使用非负稀疏编码方法将待检测图像和图像数据库中图像的局部特征编码成非负的稀疏向量；步骤3:通过所述非负稀疏向量的区域融合和空间结合而获取待检测图像和图像数据库中图像的直方图向量；步骤4:根据所述待检测图像和图像数据库中图像的直方图向量计算图像之间的相似性，并输出图像数据库中与待检测图像近似重复的图像。2.根据权利要求1所述的方法，其特征在于，所述步骤I包括: 步骤11:获取一部分已有图像作为训练图像集，并对其中的训练图像进行预处理，使得训练图像像素大小不超过预定值，对预处理后的训练图像集中的每幅图像提取表示图像视觉的局部特征SIFT描述子；步骤12:对训练集中的图像构建图像空间金字塔，对于图像空间金字塔的每ー块，把所有训练图像集中对应该块的SIFT特征集集中在一起，学习得到对应于图像空间金字塔每ー块的独立视觉词汇库，对应所述图像空间金字塔所有块的独立视觉词汇库构成了多视觉词汇库。3.根据权利要求2所述的方法，其特征在于，所述步骤2包括: 步骤21、对待检测图像和图像数据库中的所有图像预处理，使得图像像素大小不超过预定值，提取预处理后图像的表示图像视觉的局部特征SIFT描述子；· 步骤22:对待检测图像和图像数据库中每幅图像，构建图像空间金字塔，对于图像空间金字塔中每ー块，根据对应于该块的独立视觉词汇库，使用非负稀疏编码方法将待检测图像和图像数据库中每幅图像对应该块的所有SIFT描述子编码成稀疏向量。4.如权利要求3所述的方...

【专利技术属性】
技术研发人员：胡卫明，周闪，兴军亮，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人