基于视觉注意模型的图像分类方法技术

技术编号:2942002 阅读:286 留言:0更新日期:2012-04-11 18:40
一种图像分类技术领域的基于视觉注意模型的图像分类方法,包括如下步骤:步骤一,在所选图像库中随机选取一定数量的图像作为训练样本;步骤二,提取每幅图像基于视觉注意模型和全局稀少性的特征向量;步骤三,对待分类的图像计算每幅图像基于视觉注意模型和全局稀少性的特征向量;步骤四,将步骤二和步骤三中提取的特征向量送往分类器进行分类,最终得到待分类图像的分类结果。本发明专利技术可以从底层特征中获取高层的具有视觉特性的特征进行图像分类,使得分类的结果更为精准。

【技术实现步骤摘要】

本专利技术涉及的是一种图像分类
的方法,具体是一种基于视觉注意模型 的图像分类方法。
技术介绍
人眼的视觉选择性注意机制就是使我们能够在复杂的视觉环境中快速地定位 感兴趣目标。注意力使用一种信息处理瓶颈机制,它只允许一小部分进入感觉器官 的信息到达短期记忆和视觉注意区域。如果某个视觉刺激(物体)足够显著,它会从 一幅画面中凸显出来,这种显著性与观察目的无关,它是以一种快速的、自底向上 的方式起作用的。图像分类,即图像类别识别是随计算机的发展而兴起的一门学科,现已渗透各 个领域。如生物学中的色体特性研究;天文学中的望远镜图像分析;医学中的心电 图分析、脑电图分析、医学图像分析;军事领域中的航空摄像分析、雷达和声纳信 号检测和分类、自动目标识别等等。近年来,随着数字图像的普及,设计一个能自 动的管理海量图像库的图像分类方法有着巨大的现实意义。当前,对图像分类识别的常用方法是先提取图像特征,再输出给分类器进行特 征值的归类。图像特征包括几何特征、形状特征、颜色特征、纹理特征等等。所提 取到的特征被送往分类器,分类器用于对接收到的特征与数据库中的样本进行匹配 识别,判断当前图像是否属于某一类别,以及当前图像与该类别相似程度的高低。 目前常用的分类器基于以下几种分类方式,例如贝叶斯决策准则、最小距离分类方 法、支持向量机方法(Svm)、增压(Boosting)、神经网络方法等。经对现有技术文献的检索发现,Li Fei-Fei等人在proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition, vol. 2, pp:524 - 531, 20-25 June, 2005 (IEEE计算机视觉和模式识别国际会议,第 2巻,524—531页,2005年6月20—25日)上发表的文拿(ABayesian Hierarchical Model for Learning Natural Scene Categories"("学习自然场景类别的一种贝叶斯层次模型")中,提出一种提取特征向量的方法,该方法通过将整幅图像分解为很多子块(patch)的组合,对各个子块提取特征向量加以组合形成分类所需特征向量。该方法有个明显的缺陷,即对整幅图像的各个子块不加筛选的提取特征,这样所提取出的特征必然包含了图像中包括目标和背景等各个组成部分的信息,所以有较大的冗余性以及干扰性。
技术实现思路
本专利技术针对上述现有技术存在的不足,提出一种基于视觉注意模型的图像分类 方法,使其通过视觉注意模型,对图像中各像素点的显著性进行度量,加强对图像 中人眼感兴趣区域的描述,并抑制人眼所不感兴趣的区域,从而减少背景等杂乱目 标的干扰,在图像^迅速找到感兴趣的内容即注意焦点,在注意焦点的引导下高效 的完成图像分类的任务。本专利技术是通过以下技术方案实现的,具体步骤如下 步骤一,在所选图像库中随机选取设定数量的图像作为训练样本; 步骤二,提取训练样本中每幅图像的基于视觉注意模型和全局稀少型的特征向 量,具体如下首先,获取图像的亮度通道、颜色通道、方向通道以及稀少性通道, 然后,利用多分辨率处理的机制,分别为各个通道,建立高斯金字塔,其次,对于 高斯金字塔通过中心一边缘操作生成一系列特征图,其中,对亮度通道通过中心-边缘操作计算中心一边缘差,同时也计算边缘一中心差,则亮度通道被分解为两个 子通道上;最后,在各个通道内对由第六步生成的特征图进行跨尺度相加,使得每 个通道各生成一副总的特征图,并采用网格平均法对生成的各特征图提取特征向 量;步骤三,对待分类的图像也采用与步骤二相同的方法提取每副图像基于视觉注 意模型和全局稀少性的特征向量;步骤四,将步骤二和步骤三提取的特征向量送往分类器进行分类,最终得到待 分类图像的分类结果。所述获取亮度通道,对每幅输入图像提取其R、 G、 B分量值,图像的亮度通道表示为<formula>formula see original document page 6</formula>所述获取颜色通道,包括如下步骤首先,用亮度I对r、 g、 b进行归一化处理获得,、g'、 6',以去除颜色分量与亮度之间的耦合关系,并将亮度处于设定的门限值以下的像素点的颜色全部置 零,因为在亮度低的地方很难引起人眼视觉的注意;然后,将,、g'、 6'转化为四原色(Primary Colors)红色、绿色、蓝色和黄 色,分别表示为R、 G、 B、 Y,转化关系如下<formula>formula see original document page 7</formula>最后,将上述四元色合成两个"颜色对"以获取颜色通道,作为R-G颜色子通 道和B-Y颜色子通道,合成关系如下所述用亮度I对r、 g、 b进行归一化处理获得,、g'、 6',具体如下① 寻找图像亮度的最大值/ _;② 设置亮度的门限值为/_/10,选择所有亮度小于门限值的点;③设置像素点的,、g'、 6',将第②步选择的像素点设置为<formula>formula see original document page 7</formula> 其他的像素点设置为<formula>formula see original document page 7</formula>所述获取方向通道,是指通过对亮度通道进行加博(Gabor)滤波得到方向通 道,根据Gabor滤波器的方向参数将方向通道分为四个子通道,分别对应(T、 45°、 90°和135°,对亮度通道在特定方向上运用Gabor滤波器,便可得到对应的方向子 通道<formula>formula see original document page 7</formula>所述获取稀少性通道,包括如下步骤①将图像作为一系列消息附,的组合,并获得每个消息出现的频率,具体如下<formula>formula see original document page 7</formula>其中,WW(附,)为图像像素m,在统计直方图中的值,cfl^(M)为图像M中像素 点个数;②如果两个消息附,和邵具有相同的出现频率,但是其中m,比起外同其他的 消息相比具有更大的差异性,也就是附,相对于附;较为稀少,此时m,显然应该获得 较大的注意值,则引入全局区分度^^^"ce(肌)来描述消息肌和图像中其他消息的 差异性,具体如下产i③根据消息出现的频率和全局区分度来获得消息附,的自信息量,其中图像中 稀少的消息将包含较高的自信息量,具体如下-/(肌)二-log(/7(附,))所述采用网格平均法对生成的各特征图提取特征向量,是指对每一个特征图,将其划分为固定的4X4小块,并计算每一块的平均值,这样对生成的各幅颜色、 亮度、方向特征图和基于全局稀少性的特征图,分别用一个16维特征向量来表征, 最后将所有特征向量合并作为下一步图像分类的特征向量。本专利技术中的网格平均法 也可以理解为"模糊处理",是一种符合生本文档来自技高网
...

【技术保护点】
一种基于视觉注意模型的图像分类方法,其特征在于,包括如下步骤: 步骤一,在所选图像库中随机选取设定数量的图像作为训练样本; 步骤二,提取训练样本中每幅图像的基于视觉注意模型和全局稀少型的特征向量,具体如下:首先,获取图像的亮度通道、颜色通道、方向通道以及稀少性通道,然后,利用多分辨率处理的机制,分别为各个通道建立高斯金字塔,其次,对于高斯金字塔通过中心-边缘操作生成一系列特征图,其中,对亮度通道通过中心-边缘操作计算中心-边缘差,同时也计算边缘-中心差,则亮度通道被分解为两个子通道上;最后,在各个通道内对由第六步生成的特征图进行跨尺度相加,使得每个通道各生成一副总的特征图,并采用网格平均法对生成的各特征图提取特征向量; 步骤三,对待分类的图像也采用与步骤二相同的方法提取每副图像基于视觉注意模型和全局稀少性的特征向量; 步骤四,将步骤二和步骤三提取的特征向量送往分类器进行分类,最终得到待分类图像的分类结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:张瑞杨小康宋雁斓陈尔康支琤
申请(专利权)人:上海交通大学
类型:发明
国别省市:31[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利