一种基于矢量量化的全局和局部颜色图像检索方法技术

技术编号:9434675 阅读:121 留言:0更新日期:2013-12-12 00:42
一种基于矢量量化的全局和局部颜色图像检索方法。本发明专利技术提出一种新的颜色图像检索方法,涉及图像处理技术领域。该方法将RGB颜色空间转换为HSV颜色空间,运用基于神经网络的竞争学习算法训练码书,对颜色空间进行更为精确的聚类划分;引入颜色转移矩阵描述颜色的空间分布情况;将索引直方图和主颜色转移矩阵两种颜色特征相结合进行相似性度量;运用形态学开闭运算处理图像,凸显目标轮廓,以提取出局部感兴趣区域,突出了重要区域,限制背景信息。本发明专利技术提出的颜色图像检索方法克服了全局颜色直方图法对颜色空间分布描述不够,不能有效限制背景信息的缺点。使颜色量化更为准确,匹配效果更好,是进一步提高检索效率的有效方法。

【技术实现步骤摘要】
【专利摘要】。本专利技术提出一种新的颜色图像检索方法,涉及图像处理
。该方法将RGB颜色空间转换为HSV颜色空间,运用基于神经网络的竞争学习算法训练码书,对颜色空间进行更为精确的聚类划分;引入颜色转移矩阵描述颜色的空间分布情况;将索引直方图和主颜色转移矩阵两种颜色特征相结合进行相似性度量;运用形态学开闭运算处理图像,凸显目标轮廓,以提取出局部感兴趣区域,突出了重要区域,限制背景信息。本专利技术提出的颜色图像检索方法克服了全局颜色直方图法对颜色空间分布描述不够,不能有效限制背景信息的缺点。使颜色量化更为准确,匹配效果更好,是进一步提高检索效率的有效方法。【专利说明】—种基于矢量量化的全局和局部颜色图像检索方法
本专利技术属于基于内容的图像检索领域,具体涉及一种基于矢量量化的全局和局部感兴趣区域相结合的颜色检索方法。
技术介绍
随着计算机技术、多媒体技术和网络技术的发展,大量图像数据通过互联网广泛传播。然而,因缺乏有效的图像检索方法,使得对于庞大的图像数据库的利用一直处于极低的效率。对于图像数据的检索方法通常有三种:自由浏览、基于文本的图像检索(TextBased Image Retrieval,TBIR)和基于内容的图像检索(Content Based Image Retrieval,CBIR)。自由浏览只适用于偶然情况,对于经常使用特殊多媒体信息的专业客户是不合适的。基于文本的图像检索存在两方面的问题:一是需要花费大量的时间去对每一幅图像数据进行手工文字注解和分类以备建库;二是这种注解往往对于个性化的人类主观视觉内容的表达是无法精确化的。在基于内容的图像检索系统中,图像是通过对于自身的视觉内容取代关键字注解获得特征信息的,例如颜色、纹理和形状信息。它们更接近人类的视觉系统。目前图像检索技术普遍应用基于颜色的底层特征,基于形态学图像处理,基于矢量量化等技术。颜色是彩色图像最底层、最直观的物理特征,通常对噪声、图像质量的退化、尺寸、分辨率和方向等的变化具有很强的鲁棒性,是绝大多数基于内容的图像检索多媒体数据库中使用的特征之一。常用的颜色特征主要包括颜色直方图、颜色一致性矢量、颜色相关图和颜色矩阵等。其中,利用颜色直方图检索是最基本的方法,但是缺乏对颜色空间信息的描述;颜色相关图强调同一颜色在图像中的空间距离相关性;颜色矩阵主要是采用图像中各颜色的均值和方差做比较,处理简单,可以用它作为图像检索的初检,为下一步的检索缩小搜索范围。图1为一种基于全局颜色的图像检索方法流程图。数学形态学是一门以 集合代数为基础的,研究数字影像形态结构与快速并行处理的一门新兴学科。形态学图像处理的基本思想是利用一个称作结构元素的“探针”收集图像的信息。当探针在图像中不断移动的时候,便可以考虑图像各个部分间的相互关系,从而了解图像的结构特征。结构元素是形态学处理中最重要、最基本的概念,它在形态变换中的作用相当于信号处理中的“滤波窗口”。对于同一幅图像,结构元素不同,则处理的结果也不同。二值图像形态学应用中,结构元素的选取原则往往具有旋转不变性,或者至少镜像不变性,也就是说,结构元素的原点在其几何中心处,并且其他像素关于该原点呈对称状。常用到的结构元素有水平单列、垂直单列、十字型、圆盘、菱形及方形等。随着数学形态学理论的不断完善,数学形态学在图像分割中应用越来越广泛。近年来,基于矢量量化的图像检索方法成为许多学者研究的热门领域。矢量量化中一般是对图像像素块进行量化,通过传输或匹配码字的索引实现图像的传输和匹配。量化的过程可以看成是一个从k维空间Rk到其中一个有限子集Y的映射,Q: Rk — Y= (Y1, Y2,…,YnI。其基本原理是把k维空间Rk无遗漏的划分为N个互不相交的子空间(胞腔)?, R2,…,Rn。在每一个子空间Ri中找出一个代表矢量Yi= {yn,yi2,…,yik},记为矢量集Y=I Y2,…,Y1J,Y称为码书或码本,Yi称为码字或码矢,N为码书尺寸。矢量量化过程就是对一输入矢量X=Ix1, X2,…,xk},在Y中找出一个与X最相近的Yi代替X,即Yi是X的量化值。在给定待检索图像的情况下,如何快速、准确地从图像库中找到用户想要的图像是各类图像检索技术研究解决的问题,改善图像检索系统的性能已成为目前一个相当重要的研究课题。但现有技术的检索方法颜色空间量化不精确,颜色的空间分布描述不足及局部重要信息不突出,难以获得准确检索的信息。
技术实现思路
本专利技术针对现有的颜色图像检索方法中颜色空间量化不精确,颜色的空间分布描述不足及局部重要信息不突出的问题,提出颜色图像检索方法。本专利技术解决上述技术问题的技术方案是,,包括步骤:读取彩色图像数据,将其从RGB颜色空间转换到HSV颜色空间,选取相邻且互不重叠的4X4像素点作为训练矢量;采用训练矢量平方和排序的方法形成初始码书;选取图像库中的图像构成训练矢量集训练初始码书;通过统计各颜色出现的频率百分比及相邻像素块的颜色变化情况,形成颜色索引直方图和主颜色转移矩阵,将其作为检索特征;利用形态学图像处理,凸显目标轮廓以提取感兴趣局部图像区域;利用全局颜色特征和局部感兴趣区域颜色特征加权检索。具体包括: 颜色空间量化:(I)选取一幅色彩丰富且分布均匀的图像,从RGB颜色空间转换到HSV颜色空间,并将其H,S,V三个分量抽取出来;(2)选择相邻且互不重叠的4X4像素点作为训练矢量;(3)采用矢量平方和排序的方法形成初始码书;(4)在图像库各类图像中选取图像作为训练图像集,用竞争学习算法(CL算法)训练初始码书。(5)经颜色聚类,三维彩色图像可以分别获得三本码书Hi, Si, Vi,将它们合并为一个特征矢量(一本码书)ω,ω = (Hi, Si, Vi) i=l, 2,…,N,而码字索引的集合相当于一个包含N种颜色的查色表。颜色特征提取:(1)颜色索引直方图:根据查色表,将待检索图像和图像库中图像分成4X4的像素块,每个像素块通过一个码字的索引号(也即一种颜色)来表征;通过统计各码字索引出现的频率及所占百分比,得到彩色图像的颜色索引直方图H(Vl,V2…,Vi,…VN);其中,Vi表示索引号为i的码字出现的比例,N为码书尺寸。(2)主颜色转移矩阵:将图像分成mXn块,每一块均包含sXt个像素;得出每一块的主颜色索引值(也即该块中出现次数最多的索引值),形成一个二维的主颜色矩阵,其大小为mXn,记为…η ;建立一个NXN的矩阵P,其各元素的初始值为O ;将矩阵A按Z字型进行扫描,设和ap,q为扫描序列中一对相继出现的颜色(a。在前面ap,q),则P中相应元素自增1,如此反复,直到扫描完成;统计图像中各不同颜色的相邻关系及这种关系的在整幅图像所有像素块对中出现的比例。感兴趣区域提取:采用结构元素度量、提取图像中的对应形状,简化数据,保持基本形状特征并去除不相干的结构;利用开运算消除比结构元素小的散点和毛刺,切断细长搭接而起到分离的作用,即对图像进行平滑和低通滤波;利用闭运算把比结构元素小的缺口或孔洞填充上,搭接短的间断把物体连接起来,即对图像进行外部滤波,磨光凸向图像内部的尖角;经开闭运算对图像进行平滑处理,保留图像重要的轮廓、去除易造成过分划分的细节和噪声;然后设定相应本文档来自技高网
...

【技术保护点】
一种基于矢量量化的全局和局部颜色图像检索方法,其特征在于,读取彩色图像数据,将其从RGB颜色空间转换到HSV颜色空间,选取相邻且互不重叠的4×4像素点作为训练矢量;对训练矢量平方和排序形成初始码书;选取图像库中的图像构成训练矢量集训练初始码书;通过统计各颜色出现的频率百分比及相邻像素块的颜色变化情况,形成颜色索引直方图和主颜色转移矩阵,将其作为检索特征;利用形态学图像处理,凸显目标轮廓以提取感兴趣局部图像区域;利用全局颜色特征和局部感兴趣区域颜色特征加权检索,获得感兴趣区域图像。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈善学于佳佳李俊韩勇冯银波
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1