一种网络环境下的近似重复图像搜索方法技术

技术编号：11229350 阅读：100 留言：0更新日期：2015-03-29 02:55

本发明专利技术公开了一种网络环境下的近似重复图像搜索的方法，该方法包括：设计了网络图像的有效局部特征的提取和表示；利用视觉词包模型建立词典，并通过局部约束线性编码的方法对局部特征进行量化；为了将特征的空间信息嵌入图像表示，利用图像金字塔对图像进行空间弱分割，并对图像进行分块量化；将局部的量化的结果最后聚合成图像的全局描述，并计算图像之间的相似度或距离度量对待匹配图像进行相关排序，将图像序列中排在前面的图像返回。

全部详细技术资料下载

【技术实现步骤摘要】
一种网络环境下的近似重复图像搜索方法
本专利技术涉及网络多媒体信息处理领域，特别涉及一种网络图像搜索技术。背景随着互联网的普及和信息处理技术的不断发展，网络多媒体信息处理成为日益关注的焦点。多媒体包括文本，图形，声音，图像动画等各种信息院。由于当前图像处理的技术日新月异，网络图像数据量也呈现爆炸式的增长，然而这里面包含了很多经过编辑、修饰、拼接之后的重复图像。这就带来了图像盗版和侵权的问题。近年来对于近似重复图像搜索问题，众多学者展开了广泛的研究。不失一般性，近似重复图像搜索指的是找到所有的给定图像的变换拷贝图像，本专利技术关注的是“图像”类的近似重复图像搜索，即所有的拷贝图像和原始图像共有同源图像。为了有效解决近似重复图像搜索的问题，视觉词包模型成为一种被广泛应用的解决方案，它提供了一种局部图像描述的有效统计信息，并同时生成一种紧致的基于直方图统计的图像表示。词包模型最早应用于目标检测和图像分类领域。由于传统的词包模型没有考虑特征的空间分部信息，而近似重复图像存在局部差异性和整体相似性的特点，所以在进行特征量化的阶段，需要将特征的空间分布统计和特征量化相结合，对图像进行基于空间感知的区域量化。图1为网络近似重复图像的示例图，从图中可以看出，网络环境下的近似重复图像包括了更多更显著的图像变换，如：文字嵌入、图像剪裁拼接等等，这些变换明显改善了图像表观，都为网络近似重复图像搜索带来了极大的挑战。
技术实现思路
本专利技术的目的在于提出一种对图像进行基于空间感知的量化方法，以解决网络环境下近似重复图像搜索的问题。为实现上述目的，本专利技术提出一种基于空间感知的...
一种网络环境下的近似重复图像搜索方法

【技术保护点】
一种网络环境下的近似重复图像搜索方法，其特征在于，该方法包括离线阶段和在线阶段，步骤如下：离线阶段：步骤A1：提取和描述输入网络图像的低层局部特征；步骤A2：利用上述局部特征构建视觉词典，并将上述局部特征量化后，生成图相的全局特征描述；步骤A3：构建倒排序索引；在线阶段：步骤B1：提取和描述给定查询图像的低层局部特征；步骤B2：将B1种所获得的局部特征量化；步骤B3：计算查询图像与离线阶段所输入网络图像的相关性，并对带匹配图像进行排序。

【技术特征摘要】
1.一种网络环境下的近似重复图像搜索方法，其特征在于，该方法包括离线阶段和在线阶段，步骤如下：离线阶段：步骤A1：提取和描述输入网络图像的低层局部特征；步骤A2：利用上述局部特征构建视觉词典，并将上述局部特征量化后，生成图像的全局特征描述；步骤A3：构建倒排序索引；在线阶段：步骤B1：提取和描述给定查询图像的低层局部特征；步骤B2：将B1中所获得的局部特征量化；步骤B3：计算查询图像与离线阶段所输入网络图像的相关性，并对待匹配图像进行排序；其中，所述步骤A2包括：步骤A21:选取图像训练集，并提取图像训练集中所有图像的局部特征作为训练特征集，通过无监督K-均值聚类法，对训练特征集进行聚类进而生成视觉词典；步骤A22:对视觉词典进行更新，使得词典适应于输入的网络图像并保持一致性；步骤A23:在得到更新后的词典之后，利用局部约束线性编码的方法，将输入的网络图像中的所有特征进行量化，并映射到视觉词典上；步骤A24:利用图像金字塔对图像进行弱分割，将量化后的局部特征按照分块原则进行特征的聚集，并生成图像的分块表示；步骤A25:将不同层次上的所有图像分块表示串...

【专利技术属性】
技术研发人员：胡卫明，李峻，兴军亮，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人