基于频谱特征分析的图像重复检测方法技术

技术编号:2951748 阅读:295 留言:0更新日期:2012-04-11 18:40
本发明专利技术是一种基于频谱特征分析的图像重复检测方法,包括:通过下采样模块对图像进行下采样,通过频谱分析模块对图像进行频谱分析;用于提取图像像素的颜色信息;通过频谱分析模块对图像进行梯度信息分析;用于获取下采样后的图像梯度分布特征,该特征具有旋转、平移以及尺度不变的性质;通过索引生成模块融合图像颜色和梯度信息,作为图像索引。采用这种方法可以极大地减少数据库的存储冗余度,提高了现有检索系统的检索性能和效率。

【技术实现步骤摘要】

本专利技术涉及计算机应用
的多媒体检索技术,是一种基于频谱 特征分析的图像重复检测方法。
技术介绍
随着多媒体技术和计算机网络的飞速发展,全世界包括数字图像、音 频、视频在内的多媒体数据正在以惊人的速度进行增长。特别是图像数据, 由于其直观、内容表达丰富、可以进行个性化编辑等因素,非常受到用户 的青睐。但是,每天新生成的海量级的图像数据,由于其巨大的冗余性, 无情地吞噬了我们有限的存储空间,并且淹没了很多有用的信息,从而给 用户的图像数据搜索带来了很大的麻烦。如何才能使用户有效地利用信息 并对所需多媒体资源的快捷定位、方便获取以及有效管理已经是一个亟待 解决的问题,特别是那些为用户服务的互联网搜索公司以及个性化数据供 应商更是希望能够低成本地维护和更新图像数据库。然而,目前诸如google、 yahoo以及百度等成熟的商业图像搜索引擎几乎都是用文本来索 引图像的,这样就会导致在数据库出现大量的文本索引不同而内容几乎一 样的图像,从而占用了大量的宝贵的存储空间;更严重的是,用户检索服 务的质量会严重下降,因为检索出来的图像存在很大的重复性,直接会影 响用户的使用心情,造成用户的不满。因此,图像数据库中的重复检测问 题显得尤为重要,然而重复检测问题的核心是图像表达。只要数据库中的 图像索引做得好,就能有效地进行图像重复检测。图像表达的本质是寻找一个合适的特征映射函数,该函数能够将图像 映射到一个不仅类内相似度高而且类间相似度也低的高维空间。在图像表 达研究领域,大致存在两种类型的特征映射函数,它们分别是基于底层视 觉特征和高层语义特征,我们称它们为底层特征映射函数和高层语义特征映射函数。底层特征映射函数主要是获得图像的一些底层信息,这些信息 主要包括颜色、纹理、梯度等。该函数的主要优点是操作方便,灵活度高, 计算复杂度低等,其主要缺点是缺乏图像的高层语义信息。相比之下,高 层语义特征映射函数主要是获得图像里的存在的目标或者整个图像场景 的语义信息,其主要优点是能够有效进行图像理解,从而较准确地表达图 像,但是,其主要的缺点是计算复杂度高,需要设定参数较多,灵活度低, 不能够被大规模地使用。综合以上两种映射函数的优缺点以及图像数据库 重复检测问题本身的特性,我们决定采用底层特征映射函数去捕获图像信 息,其主要原因如下(1)图像数据库的规模比较大,对计算复杂度的要 求非常严格;如果采用高层语义特征映射函数的话,数据库维护和更新的 代价非常巨大。(2)图像重复检测这个问题本身对图像内容表达的要求不 高。通常,两幅重复的图像是可以通过一些变换进行相互转换的,这些变 换主要包括平移、旋转以及尺度,且其变换幅度非常小。底层特征映射函 数完全可以处理以上这些变换所造成的影响。(3)底层特征映射函数灵活度高,易于计算机处理;而高层语义特征映射函数正好相反,它受到诸多因素的限制,需要事先设置很多的经验参数,不利于计算机处理。于是在 这种背景下,我们提出了一种融合图像颜色和梯度信息的特征。在该特征 中,图像颜色信息是通过图像的频谱来体现的,而图像梯度信息主要是通 过图像梯度方向直方图的频谱来体现的。在以下几个部分,我们将详细介 绍该特征。
技术实现思路
本专利技术提出了一种,这种方法 采用了集成了图像颜色和梯度信息的图像索引,,应用于图像重复检测领 域。本专利技术提出的基于频谱分析的图像重复检测方法,包括 采用下采样模块对图像进行下采样,用于缩短图像频谱分析的计算时间;采用频谱分析模块对图像进行频谱分析,用于提取下采样后的图像的低频谱信息,得到图像像素的颜色信息;采用频谱分析模块对图像进行梯度信息分析;用于获取下采样后的图像梯度分布特征;采用索引生成模块融合图像颜色和梯度信息,作为图像索引; 以图像索引为依据,检测图像是否重复。进一步,所述下采样后的图像的低频谱信息包括旋转、平移以及尺度 不变。进一步,所述下釆样后的图像梯度分布特征具有旋转、平移以及尺度 不变的性质。进一步,所述频谱分析步骤包括 对图像进行傅立叶变换,获取其幅度谱; 对幅度谱进行对数极坐标映射形成一幅新的图像; 对这幅新的图像进行傅立叶变换,获得幅度谱; 仅保留低频谱信息,用来刻画图像颜色分布的特征。 进一步,所述梯度信息分析步骤包括 提取图像每一个像素的梯度,统计所有像素的梯度方向; 将方向空间量化为n个等级;将每一个像素的梯度方向映射到相应的等级,构建成了一个梯度方向 直方对直方图进行傅立叶变换,取其幅度谱; 将幅度谱作为刻画图像梯度信息的特征。本专利技术提出的,使用的图像底 层特征较好地表达了图像中的结构和细节信息;其作为图像索引,可以有 效地检测出图像数据库中文本索引不同而内容几乎一样的图像,从而极大 地节约了宝贵的存储空间,从而提高了用户检索服务的质量。附图说明图l为本专利技术系统结构框图2为本专利技术检测重复山河图像的应用实例;图3为本专利技术检测重复飞机图像实例;图4为本专利技术检测重复溪流图像实例。 具体实施例方式下面将结合附图对本专利技术加以详细说明,应指出的是,所描述的实施 例仅旨在便于对本专利技术的理解,而对其不起任何限定作用。本专利技术总体结构由以下三个模块组成 一、下采样模块,该模块的功 能是对图像进行下采样。二、频谱分析模块,该模块的功能是进行图像频 谱分析和图像梯度信息分析。三、图像索引生成模块,该模块的任务是将 频谱分析模块得到的两种特征统一起来,从而形成一个对图像旋转、平移 以及尺度变化非常鲁棒的图像索引。我们利用这个索引来进行图像重复检 测。图l显示了本专利技术的整体结构。下面详细给出该专利技术技术方案中所涉及的各个细节问题的说明。1) 通过下采样模块对图像进行下采样。首先将图像进行下采样,这样做的目的是降低计算复杂度,同时也能 获取图像大尺度的结构信息。通常,下采样率是0.5,也就是图像的尺寸 变成原来的一半。此外,如果要处理的图像是彩色图像,那么我们首先将 彩色图像转换为灰度图像。2) 通过频谱分析模块对图像进行频谱分析。对下釆样后的图像进行傅立叶变换,获取其幅度谱;然后对幅度谱进 行对数极坐标映射形成一幅新的图像;接着对这幅新的图像进行傅立叶变 换,获得幅度谱;最后仅保留一些低频率的谱信息。经过以上处理后所获 得的谱信息是不变于图像尺度、旋转以及平移变换的,这些属性可以通过 我们以下的理论分析得到证实。给定一幅原始图像/。(A力,我们对它进行旋转、尺度以及平移变换 后得到一幅新的图像/6&,力,其中旋转角度是",尺度因子是^, X 方向的平移量为A,以及^方向的平移量为^,以上变换过程可以用以 下的公式说明厶(x,y) = /。 。 我们分别对/。"力和厶(&力迸行傅立叶变换,得到对应的频谱《(",v)和《(",V)。根据傅立叶变换理论,F。(W,V)和《(M,V)存在以下的关系7二 e- 'v) {尸。cr_1(wcos" +vsina)o, cr-、-w sin a + vcos a)其中,^(",v)是y;(x,力的相位谱,该相位谱与旋转角度、尺度因子以及平移量有关;但如果我们只考虑幅度频谱i巧(",力i,就会发现^(",v)l是平移不变的,艮口《(w, v) = a—2 Fa cr—cos a+ vsina)0,cr_1(—w本文档来自技高网
...

【技术保护点】
一种基于频谱分析的图像重复检测方法,其特征在于,包括: 通过下采样模块对图像进行下采样,用于缩短图像频谱分析的计算时间; 通过频谱分析模块对图像进行频谱分析,用于提取下采样后的图像的低频谱信息,得到图像像素的颜色信息; 通过频谱分析模块对图像进行梯度信息分析,用于获取下采样后的图像梯度分布特征; 通过索引生成模块融合图像颜色和梯度信息,作为图像索引; 以图像索引为依据,检测图像是否重复。

【技术特征摘要】

【专利技术属性】
技术研发人员:胡卫明李玺吴偶
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1