基于信息突变的图像检索方法技术

技术编号:2947298 阅读:243 留言:0更新日期:2012-04-11 18:40
一种基于图像突变的图像检索方法,涉及图像检索领域。目前,复杂背景下图像的自动分割方法过于简单,且容易破坏图像内部语义的相关性。本发明专利技术的首先将用户上传的样例图像的颜色数据从GRB空间转换到HSV空间,并归一化处理;然后根据像素间的相关性和信息突变特性,对图像进行初始分割,并根据分割后的像素块间的相似性,进行循环合并,将图像分割为3×3子块;分别抽取9个区域的特征向量,即HSV颜色直方图、分块主色以及中心矩;由用户从9个区域中选取感兴趣区域,与待检索图像进行的进行相似性比较,得到进行图像检索结果。本发明专利技术在图像的检索过程中兼顾检索算法的低复杂度与图像语义贴合性,检索结果与人类认知具有良好的一致性。

【技术实现步骤摘要】

本专利技术涉及图像检索领域,设计和实现了一种基于信息突变的图像检索算法。
技术介绍
随着互联网上大规模图像数据的激增,传统的文本搜索引擎已远不能满足人们信息检索的需求,基于内容的检索技术逐渐成为目前多媒体信息检索、人工智能、数据库等领域中一个新的研究热点。基于内容的图像检索方法涉及到两个关键技术图像特征的提取、表示方式以及检索算法中相似性度量准则的设定。目前,基于内容的图像特征提取、表示多是从图像的颜色、形状、纹理等底层特征入手,利用颜色直方图、共生矩阵、形状不变矩等对图像进行描述与存储,但这些方法都有其固有的缺陷。颜色直方图计算简单,但丧失了图像的空间信息;共生矩阵虽然兼顾了颜色和空间两方面的信息,却带来了算法复杂度的增加。为解决以上问题,一些检索系统,如BlobWorld系统和Netra系统等,在特征提取前对图像进行预分割,获得图像不同的目标区域,然后再基于图像区域抽取特征,由此获得了比基于全局图像特征更好的检索结果。目前,复杂背景下图像的自动分割还是一个难点问题,而且即使得到这样的区域,要想对其正确表征需要抽取多维特征。对于大型图像数据库而言,高维向量的存储,以及高维空间中距离的计算,将导致算法复杂度成数量级增加。基于此,许多学者提出了一种提取图像的粗略区域的方法。其传统做法为对图像进行固定子块的划分,提取各个子块的特征并进行检索。这种做法虽然考虑了图像的空间位置信息,但其分割方法过于简单,且容易破坏图像内部语义的相关性。因此,研究如何兼顾特征抽取、存储,检索算法的低复杂度与图像语义贴合性两方面的因素,将是一个有意义的尝试。
技术实现思路
本专利技术的目的是充分利用图像中所蕴含的丰富的颜色和空间信息,提出一种基于信息突变的图像检索方法。它根据图像特征制定相应的策略,通过粗略区域划分获得有意义的分割结果,并在此基础上抽取区域特征和设计相应的相似性度量算法,从而实现基于内容的图像检索。人类观察一幅图像时,总是依其颜色分布和目标物体形状进行识别。而目标物体边缘的局部小区域内往往对应着颜色信息的突变,因此,本专利技术把图像划分的关注点聚焦到颜色信息的突变上,并在此基础上制定相应的判别准则实现彩色图像自适应分割的目的。然后,分别抽取图像各个区域的HSV颜色直方图、分块主色以及中心矩,对图像区域特征进行刻画;在此基础上,本专利技术以直方图交叉距离为依据,利用分块主色对其进行加权后作为分子,用中心矩的差的平方作为分母,制定了图像的加权直方图距离实现对两幅图像进行相似性度量的目的。本专利技术的技术思路特征为1.在图像分割过程中,利用图像的目标物体边缘的局部小区域内对应颜色信息突变的特点,对图像进行初始分割。2.在每一次块搜索的过程中,利用当前像素块与相邻行、列像素之间有相关性的特点,通过垂直、水平拓展(见图1),得到一个衡量颜色信息突变程度的拓展像素块,分别计算两者的颜色均值,相减后得到信息残差。3.根据以上得到的信息残差,与一经验阈值相比较(该阈值取值为8,是由大量实验获得的),若大于阈值则表示拓展像素块中存在颜色信息突变,本次块搜索结束,返回下一次块搜索的初始像素,重新开始块搜索;否则将继续进行本次块搜索,即继续向外拓展。4.在一个方向(图像的横向或竖向)上利用块搜索规则反复进行块搜索,直到到达图像边界(图像的宽或高),这样,将得到若干尺寸不等的像素块,将这样一次搜索定义为一次方向搜索(根据搜索方向不同分为横向搜索或竖向搜索)。根据这些得到的像素块,分别取其中具有最大或最小尺寸的像素块,将其对应尺寸作为本次方向搜索的最终分割的尺寸(见图2)。5.在横、竖两个方向上分别反复进行方向搜索,直到到达图像边界,最终得到图像的初始分割方案(见图3(a))。6.在垂直、水平两个方向分别对图像的初始分割区域进行合并,不断合并区域距离最小的两个区域,直到图像被划分为3×3子块,即9个区域(见图3(b))。7.根据图像分割结果,分别抽取图像各个区域的HSV颜色直方图、分块主色以及中心矩,对区域特征进行刻画。8.在检索过程中,本专利技术以利用主色进行加权后的直方图交叉距离为分子,用中心矩的差的平方作为分母,制定了图像的加权直方图距离,实现对两幅图像进行相似性度量的目的。9.综合考虑,本专利技术在图像分割、区域特征提取以及图像检索的各个环节都充分考虑到图像颜色和空间信息的综合利用。通过检测颜色信息突变的方法对图像进行分割处理,区分出图像的目标区域和背景,得到符合人类视觉感知的图像区域;加权颜色直方图距离的制定充分利用图像分割和区域特征提取所获得的信息,大幅提高了图像的查准率,具有很好的检索效果。本专利技术的技术方案流程图参见图4、图5。图4是本专利技术图像最大行距横向搜索方法的流程图,图5是本专利技术的整个检索方法的流程图。一种基于信息突变的图像检索算法,其特征在于,包括下述步骤1)读入用户从外接数码相机中上传的或者读入计算机里储存的样例图像Sample,将其从RBG转换到HSV颜色空间,并将其中的色调H、饱和度S、亮度V三个分量按照公式(1)计算得到归一化分量L后,将L作为像素的颜色值;L=16H+4S+V (1)2)将图像左上角的像素P0(0,0)作为初始种子点,分别向下、向右扩展一行、一列像素,得到一正方形区域,计算该正方形区域内所有像素的颜色值的平均值,然后计算其与初始种子点颜色值的差值Dif,将Dif与阈值Thred=8相比较,若Dif>Thred则表示该区域中存在颜色信息突变;否则,仍以图像左上角的像素P0(0,0)为初始种子点,以刚搜索完的区域为基础,再分别向下、向右扩展一行、一列像素,得到一新的正方形区域,计算该区域的颜色均值arg(new),然后计算其与扩展前正方形区域的颜色均值arg(origin)的差值Dif,如(2)式所示Dif=arg(origin)-arg(new) (2)式中arg(origin)=1(k-1-br)(s-1-bc)Σi=bri=k-1Σj=bcj=s-1Pij---(3)]]>arg(new)=1(k-br)(s-bc)Σi=bri=kΣj=bcj=sPij---(4)]]>其中,br是初始种子的行号、bc是其列号,它们的初始值都为0;k和s分别代表新得到的正方形区域的右下角像素的行号、列号;Pij表示第i行、第j列像素的颜色特征向量L的值;再将Dif与阈值Thred相比较,直至Dif>Thred即该区域中存在颜色信息突变时,本次搜索结束,将刚搜索过的区域定义为一个块,将对该块的搜索定义为一个块搜索;3)以2)为基础对图像进行多方位、多尺寸的方向搜索,搜索分4次进行,分别为最大行距横向搜索、最小行距横向搜索、最大列距竖向搜索及最小列距竖向搜索;横向搜索a1、重新定义2)中得到的块的右上角点的像素Pl(i,j)为新的初始种子点;b1、以新定义的初始种子点为起点,分别向下、向右扩展一行、一列像素,得到一正方形区域,计算该正方形区域的颜色均值,然后计算其与新的初始种子点颜色值的差值Dif,将Dif与阈值Thred相比较,若Dif>Thred则表示该区域中存在颜色信息突变;否则,仍以新定义的初始种子点为初始种子点,以刚搜索本文档来自技高网...

【技术保护点】
一种基于信息突变的图像检索算法,其特征在于,包括下述步骤:1)读入用户从外接数码相机中上传的或者读入计算机里储存的样例图像Sample,将其从RBG转换到HSV颜色空间,并将其中的色调H、饱和度S、亮度V三个分量按照公式(1)计算得 到归一化分量L后,将L作为像素的颜色值;L=16H+4S+V(1)2)将图像左上角的像素P↓[0](0,0)作为初始种子点,分别向下、向右扩展一行、一列像素,得到一正方形区域,计算该正方形区域内所有像素的颜色值的平均值, 然后计算其与初始种子点颜色值的差值Dif,将Dif与阈值Thred=8相比较,若Dif>Thred则表示该区域中存在颜色信息突变;否则,仍以图像左上角的像素P↓[0](0,0)为初始种子点,以刚搜索完的区域为基础,再分别向下、向右扩展一行、一列像素,得到一新的正方形区域,计算该区域的颜色均值arg(new),然后计算其与扩展前正方形区域的颜色均值arg(origin)的差值Dif,如(2)式所示:Dif=arg(origin)-arg(new)(2)式中: arg(origin)=1/(k-1-br)(s-1-bc)**P↓[ij](3)arg(new)=1/(k-br)(s-bc)**P↓[ij](4)其中,br是初始种子的行号、bc是其列号,它们的初始值都为0;k和 s分别代表新得到的正方形区域的右下角像素的行号、列号;P↓[ij]表示第i行、第j列像素的颜色特征向量L的值;再将Dif与阈值Thred相比较,直至Dif>Thred即该区域中存在颜色信息突变时,本次搜索结束,将刚搜索过的区域定义为 一个块,将对该块的搜索定义为一个块搜索;3)以2)为基础对图像进行多方位、多尺寸的方向搜索,搜索分4次进行,分别为最大行距横向搜索、最小行距横向搜索、最大列距竖向搜索及最小列距竖向搜索;横向搜索:a1、重新定义2)中 得到的块的右上角点的像素P↓[1](i,j)为新的初始种子点;b1、以新定义的初始种子点为起点,分别向下、向右扩展一行、一列像素,得到一正方形区域,计算该正方形区域的颜色均值,然后计算其与新的初始种子点颜色值的差值Dif,将Dif与 阈值Thred相比较,若Dif>Thred则表示该区域中存在颜色信息突变;否则,仍以新定义的初始种子点为初始种子点,以刚搜索完...

【技术特征摘要】

【专利技术属性】
技术研发人员:贾克斌王妍刘鹏宇
申请(专利权)人:北京工业大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1