一种基于改进SIFT特征的高效图像检索方法技术

技术编号:13244371 阅读:62 留言:0更新日期:2016-05-15 04:46
一种基于改进SIFT特征的高效图像检索方法,本发明专利技术涉及图像处理和计算机视觉领域,属于基于内容的图像检索方法。本方法的流程如下,高斯差分尺度空间的建立;在尺度空间检测极值点作为特征点;计算特征点的方向及方向上的梯度模值;利用地理统计方法生成图像特征点的全局特征向量;全局特征向量相似性匹配完成粗检索;在粗检索的基础上生成特征描述子;特征描述子的匹配完成精检索;本发明专利技术提出的创新性图像检索方法比传统的SIFT算法优秀,比现有的检索算法更适用于数字出版物中图像侵权审查的要求。

【技术实现步骤摘要】

本专利技术涉及图像处理和计算机视觉领域,属于基于内容的图像检索方法。 技术背景 随着计算机技术、通讯技术、网络技术、流媒体技术和存储技术等高新技术的飞速 发展,数字出版蓬勃发展,成为新闻出版业的战略性新兴产业和出版业发展的主要方向。同 时,数字出版带来的知识产权的保护问题引起了社会的高度重视。如果对于版权问题的审 查不全面或者不深入,将很有可能导致数字出版物在传播后引发版权纠纷,所以数字出版 物出版前的侵权问题审核成为了数字出版社的重要工作。而现实中,数字出版物的侵权审 查工作主要依靠人工来完成,耗费了大量的人力物力。因此,数字出版物侵权审查工作的智 能化具有重大的实际应用价值。数字出版物的内容可以分为文本、图像、音频、视频和应用 程序等,其中图像是数字出版物的重要内容之一。数字出版物中图像侵权审查的智能化具 有很大的研究价值。 为实现智能化的图像侵权审查,需依托于图像检索技术。将数字出版物中的参考 图像作为待检索图像,将数字出版社提供的有版权图像库作为检索图库,利用图像检索技 术从检索图库中检索出与待检索图像高度相似的图像作为检索结果。最后,检索结果再经 进一步的人工认定来最终确定是否存在图像侵权行为。 与数字出版社有版权图片库中具有版权的正规清晰图片相比,数字出版物中提取 出的待检索图像很可能是这些有版权图片的变形,如尺寸变化、亮度变化、目标的旋转、平 移、仿射变换、模糊化等。然而,目前主流的基于内容的图像检索方法多利用颜色,纹理,形 状以及空间关系等图像的底层特征来描述图像,这些特征对图像目标亮度、尺寸变化、目标 旋转以及仿射变换等比较敏感,不能很好的适用于数字出版社版权图片的检索。所以研究 改进得到一种能够应对图像尺度、方向、亮度以及仿射变化的检索算法很有必要。 SIFT(Scale Invariant Feature Transformation),即尺度不变特征变换,是由 加拿大英属哥伦比亚大学的David Lowe教授于1999年提出的,并于2004年对其进行了进一 步的改进和完善。SIFT是一种基于尺度空间的,对图像的缩放、平移、旋转,光照变化保持很 好的不变性,对仿射变换、目标遮挡、噪声也保持了很好稳定性的一种局部特征。SIFT特征 很好地满足了基于数字出版物版权审核的图像检索的鲁棒性要求,但是SIFT特征也存在很 多不足之处,如算法的复杂度较高,提取的特征点数太多,模板太大,占用太多内存;在特征 描述子生成时产生了 128维的特征描述子,运算时间较长;SIFT算法匹配完成后,存在特征 点误匹配情况。若要提高检索精度,并且提高检索速率,必须对SIFT算法的不足之处进行改 进。 鉴于此,本专利技术提出了一种基于改进SIFT特征的高效图像检索方法,将SIFT算法 过程首创性地分为两个阶段,分别用于实现粗检索和精检索。在粗检索过程中,创新性地引 入地理统计(Geographical Statistics ,GeoStat)方法来描述图像中不同方向特征点的全 局空间关系,然后生成一个144维的特征向量来表示每张图像,并通过比较图像间该特征向 量的相似性来完成粗检索。在精检索过程中,只考虑粗检索的结果中与待检索图像相似度 比较高的部分图像作为精检索的图像库,并改进算法的索引和匹配过程中,通过增加一个 图像间的特征点数目比值的判断过程来提高匹配速度,降低误匹配率。实验结果表明,与原 始的SIFT算法相比,本专利技术提出的改进算法具有更高的检索速度和更高的检索精度。该算 法也更适用于数字出版物中的参考图像的侵权检索过程。
技术实现思路
本专利技术提出了一种基于改进SIFT特征的高效图像检索方法,旨在将数字出版物中 参考图像的侵权审查过程智能化,其系统结构如图1所示。 该系统由图像预处理模块、图像检索模块和图像检索结果分析及显示模块三部分 组成;图像预处理模块、图像检索模块和图像检索结果分析及显示模块依次相连。所述图像 预处理模块主要包括图像的彩色与灰度空间转换、图像的尺寸调整两个子模块;所述图像 检索模块主要包括图像特征提取及特征向量生成、特征库生成、索引结构建立及特征匹配 三个子模块;所述图像检索结果分析及显示模块,主要将图像检索结果根据相似度从高到 低排序显示出来,该结果用于判断参考图像是否存在侵权行为。该系统的核心是图像检索 丰旲块。 基于上述系统,本专利技术提出了一种基于改进SIFT特征的高效图像检索方法,其方 法流程图如图2所示。该方法的具体步骤描述如下: si:高斯差分尺度空间的建立 为了保证提取的图像特征具有尺度不变性和高度稳定性,SIFT算法在高斯差分尺 度空间上进行特征点的定位。 S2:在尺度空间检测极值点作为特征点 SIFT算法将特征点定义为高斯差分尺度空间内的局部极值点,该局部极值的概念 包含了两方面涵义:一是图像空间极值,即此极值点是在与其同层的3X3邻域的9个点内的 局部极值点;二是尺度空间极值,即该点与其两个相邻层内对应点的3 X 3邻域共27个点内 的局部极值点。经过极值点的检测可以初步定位特征点的位置和所在的尺度。高斯差分尺度算子会产生较强的边缘响应,为了增强匹配的稳定性,提高抗噪声 能力,需要进一步精确定位极值点,去除低对比度的特征点和不稳定的边缘响应点。SIFT算 法采用了Brown提出的三维二次函数拟合DOG空间的局部极值点,计算极值点插值后的位 置,来精确定位极值点,并将修正后的新特征点带入尺度空间函数在原极值点处的二级泰 勒展开式中,当得到的值的绝对值小于某一阈值时,则认为该极值点的对比度低,舍去该极 值点。将大曲率的边缘点作为不稳定的边缘响应点筛选掉,其中主曲率可以通过一个2 X 2 的Hessian矩阵求出。 S3:计算特征点的方向及方向上的梯度模值为了保证特征点及后边生成的特征描述子的旋转不变性,SIFT算法利用特征点邻 域像素的梯度分布特性给每个特征点赋一个方向。本专利技术在此提出了改进思路,不仅给每 个特征点赋予一个方向,还为每个特征点赋予该方向上的梯度模值。这两个特征值为下一 步引入地理统计(Geographical Statistics,GeoStat)方法来描述图像中不同方向特征点 的全局空间关系做准备。 S4:利用地理统计(GeoStat)方法生成图像特征点的全局特征向量 本专利技术创新性地提出了改进的地理统计(GeoStat)方法来描述图像特征点的分布 特征,并生成144维的特征向量来表示每幅图像。 S5:全局特征向量相似性匹配完成粗检索 参考传统地理统计(GeoStat)方法中的相似性度量准则,本专利技术提出了一种改进 的相似性度量准则。利用该准则,将待检索图像的全局特征向量分别和图库中图像的全局 特征向量进行相似性度量,并将图像按其相似度由高到低排序。本专利技术中,将相似度排名靠 前的图像作为粗检索的结果,并将这些粗检索结果图像生成新的图片库,用于完成之后的 精检索。 S6:在粗检索的基础上生成特征描述子 在粗检索结果的基础上,为待检索图像和筛选的得到的相似图像进行更加精准的 描述来实现精细筛选。对于每张图像,为了更加细致地描述特征点的特征,使匹配更加精 准,为图片中的每个特征点计算其相应的128维的特征描述子。 S7:特征描述子的匹配完成本文档来自技高网
...

【技术保护点】
一种基于改进SIFT特征的高效图像检索系统,其特征在于:该系统由图像预处理模块、图像检索模块和图像检索结果分析及显示模块三部分组成;图像预处理模块、图像检索模块和图像检索结果分析及显示模块依次相连;所述图像预处理模块主要包括图像的彩色与灰度空间转换、图像的尺寸调整两个子模块;所述图像检索模块主要包括图像特征提取及特征向量生成、特征库生成、索引结构建立及特征匹配三个子模块;所述图像检索结果分析及显示模块,主要将图像检索结果根据相似度从高到低排序显示出来,该结果用于判断参考图像是否存在侵权行为;该系统的核心是图像检索模块。

【技术特征摘要】

【专利技术属性】
技术研发人员:孙光民王晨阳
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1