一种实现场景图像的分类方法技术

技术编号:3965958 阅读:337 留言:0更新日期:2012-04-11 18:40
本发明专利技术是一种实现场景图像的分类方法,该方法采用两级分类器对场景图像进行分类,第一级分类器利用全局结构信息特征得到候选类别,并通过分类结果判定相似类别对,第二级分类器则利用局部纹理信息特征区分相似类别,采用分类器的级联综合利用场景图像的全局结构信息特征和局部纹理信息特征,使得该方法做到不同场景类别鲁棒分类,相似场景类别有效区分。

【技术实现步骤摘要】

本专利技术属于模式识别与信息处理
,涉及数字图像的自动处理技术,尤其 涉及一种场景图像的分类方法。
技术介绍
随着数码相机、摄像头、超高速扫描仪等各种图像获取设备的广泛应用以及互联 网的迅猛发展,数码图像的数量呈指数级增长,据不完全统计仅2004年就产生了超过180 亿的数码图像,而Google Image Search已经索引的图片更是数以亿计,因此如何将图像进 行有效的分类变得越来越重要。一个人通常可以识别10,000多个类别的视觉对象,而且识 别过程很快,毫不费力,对视角、光亮、遮挡和背景混淆也有很好的鲁棒性,并且识别一种新 的类别仅需要很少的监督和少量样本即可。因此,如何使计算机达到人类同等水平的类别 识别能力具有重要意义,这也成为计算机视觉领域的一个重要和热点问题之一。场景图像 分类的主要目标就是根据图像中包含的场景将图像分为不同的类别,例如卧室、起居室、商 店、海岸等。良好的视觉对象分类效果具有广泛的应用前景,可以广泛应用于图像检索、视 频分析、辅助驾驶、视频监控等等领域。针对场景图像的分类问题,国内外的学者都提出了很多算法,根据提取场景图像 特征的不同,大致可以分为两类一种是基于图像的结构信息,另一种是基于图像的纹理信 息。基于图像的结构信息的分类方法通常是从图像的全局特征出发,通过抽取图像的边缘 和轮廓信息或统计图像的梯度或方向直方图来表示一幅图像。这种特征具有一定的适应性 和鲁棒性,能够克服同类场景图像内的细微变化。而基于图像的纹理信息的分类方法一般 是从图像的局部特征开始,通过图像检测算子获得图像的稳定兴趣点,针对兴趣点附近的 纹理信息进行描述后再通过一定的特征映射来表示一幅图像。这种方法具有较强的区分能 力,能够捕捉到场景图像的细微变化,近年来也被广泛采用。当不同类别的场景图像具有比 较明显的区分度时,仅仅采用结构信息就可以达到令人满意的效果,但是当不同类别的场 景图像具有相近或相似的结构信息时,受限于全局性特征,第一种方法就会出现很多分类 错误,比如卧室类场景和起居室类场景的分类。而第二种方法虽然能够通过局部纹理区分 相近或相似的图像,但是较强的区分能力降低了分类方法的适应性和鲁棒性,往往导致原 本属于同一类别的场景图像也会判定为不同的类别。在场景图像分类问题中,除了选取良好的特征之外,如何选择合理的分类方法也 是提高场景图片分类性能的一个重要方面,常用的分类器有最近邻分类器,神经网络以及 支持向量机等。最近邻分类器计算速度快,结合良好的数据结构和算法优化可以满足对性 能要求比较高的分类计算,而神经网络和支持向量机等分类器适合于图像特征维数比较 高,分布比较复杂的分类计算,在增加一部分计算复杂度的情况下提高分类的准确率。现有 的场景图像分类方法往往采用单一的分类器,并且根据对场景图像的经验观察只选取单级 分类器来完成最后的分类,这种方法并不能有效利用图像的各种特征信息,忽视了分类器 的融合和级联所能利用的不同特征的互补性优势,使得场景图像的分类尚未达到令人满意的效果。
技术实现思路
本专利技术旨在提供一种实用的场景图像分类方法,针对场景图像的特点,通过设计 合理的多级分类机制,融合场景图像的整体结构信息和局部纹理信息,使其达到优势互补, 从而提高场景图像的分类准确率。本专利技术适用于复杂的场景图像分类,不仅能够通过结构 信息区分类别相差比较大的场景图像,也可以通过局部纹理信息分类相近或相似的场景类 别,具有一定的通用性和实用性。为达成上述目的,本专利技术提供一种场景图像的全局结构信息特征的提取方法,该 提取方法的具体步骤如下步骤S1 使用场景图像读取模块读取场景图像,并使用灰度图像判断模块判断该 场景图像是否为彩色图像,若为彩色图像则使用灰度图像转换模块将彩色图像进行转换, 得到灰度图像,若为灰度图像则执行步骤S2 ;步骤S2 使用图像等级划分模块对灰度图像按照三个级别进行划分,得到第一级 划分、第二级划分和第三级划分对应的图像块;经过三级划分后,得到31个图像块;步骤S3 使用局部二元模式特征计算模块对图像块中每个像素的结构信息特征 进行计算,得到一个8维局部二元模式特征;步骤S4:使用局部二元模式特征量化模块对8维局部二元模式特征进行量化,得 到1维局部二元模式量化特征,并使用直方图计算模块计算1维局部二元模式量化特征的 直方图,得到255维直方图特征Hps ;使用主成分分析计算模块对255维直方图特征Hps进行 主成份分析,得到40维直方图特征Hp ;再使用直方图计算模块计算8维局部二元模式特征 的直方图,得到8维直方图特征Hb ;最后使用直方图特征融合模块将8维直方图特征Hb和 40维直方图特征Hp融合,得到一个图像块对应的48维结构信息特征Hf = (Hb,Hp); 步骤S5 使用计数模块判断所有31个图像块的48维结构信息特征Hf是否全部计 算完毕,若没有重复步骤S3至S4,若全部计算完毕,执行步骤S7 ;步骤S6 使用结构信息特征融合模块对所有31个图像块的48维结构信息特征Hf 进行融合,得到一幅图像的全局结构信息特征Hg = (Hfl,Hf31);步骤S7 使用分类器训练模块对全局结构信息特征训练,得到第一级分类器;步骤S8 用第一级分类器对场景图像进行分类,得到以概率形式表示的分类结果 R = (Rn,R12,...,Rln),其中R (i G )按照从大到小排列,n为场景图像的类别个 数;步骤S9 使用相似类别对计算模块统计分类结果札中前两个候选的可能情况,即 统计(Rn,R12)的可能组合,得到N个相似类别对,Ne ,为了降低后续的计算 复杂度,N—般可设为n/5 ;步骤S10 使用局部纹理特征计算模块针对N个相似类别对进行计算,得到场景图 像的局部纹理信息特征;步骤S11 使用分类器训练模块对局部纹理信息特征训练,得到N个第二级分类 器;步骤S12 用第二级分类器对场景图像进行分类,得到N个以概率形式表示的分类结果Q = (Cn,Ci2),i G ,其中Cn,Ci2按照从大到小排列;步骤S13 使用分类结果融合模块将步骤S8得到的结果礼与步骤S12得到的结果 融合,得到场景图像的最终分类结果。本专利技术的融合全局结构信息和局部纹理信息实现场景分类的方法,既有效利用了 结构信息分类快速的优点,又利用了纹理信息鉴别能力强的优势,提高了场景图像的分类 准确率。并且由于采用了自己设计的全局结构信息特征,运算速度快、抗噪声和鲁棒性好。附图说明图1是本专利技术实施例的系统结构示意图;图2是本专利技术实现方案流程图;图3是本专利技术对场景图像的三级划分示意具体实施例方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照 附图,对本专利技术进一步详细说明。如图1示出本专利技术的系统结构示意图,实现本专利技术的系统结构所需的基本的硬件 条件为一台主频为2. 4GHz,内存为1G的计算机;所需软件条件为编程环境(Visual C++ 6. 0),本专利技术的系统结构在计算机中实现,包括场景图像读取模块1、灰度图像判断模块 2、灰度图像转换模块3、图像等级划分模块4、局部二元模式特征计算模块5、局部二元模式 特征量化模块6、直方图计算模块7、主成分分析计算模块8、直方图特征融合模本文档来自技高网
...

【技术保护点】
一种实现场景图像的分类方法,其特征在于:该方法的实现具体步骤如下:步骤S1:使用场景图像读取模块读取场景图像,并使用灰度图像判断模块判断该场景图像是否为彩色图像,若为彩色图像则使用灰度图像转换模块将彩色图像进行转换,得到灰度图像,若为灰度图像则执行步骤S2;步骤S2:使用图像等级划分模块对灰度图像按照三个级别进行划分,得到第一级划分、第二级划分和第三级划分对应的图像块;经过三级划分后,得到31个图像块;步骤S3:使用局部二元模式特征计算模块对图像块中每个像素的结构信息特征进行计算,得到一个8维局部二元模式特征;步骤S4:使用局部二元模式特征量化模块对8维局部二元模式特征进行量化,得到1维局部二元模式量化特征,并使用直方图计算模块计算1维局部二元模式量化特征的直方图,得到255维直方图特征H↓[ps];使用主成分分析计算模块对255维直方图特征H↓[ps]进行主成份分析,得到40维直方图特征H↓[p];再使用直方图计算模块计算8维局部二元模式特征的直方图,得到8维直方图特征H↓[b];最后使用直方图特征融合模块将8维直方图特征H↓[b]和40维直方图特征H↓[p]融合,得到一个图像块对应的48维结构信息特征H↓[f]=(H↓[b],H↓[p]);步骤S5:使用计数模块判断所有31个图像块的48维结构信息特征H↓[f]是否全部计算完毕,若没有重复步骤S3至步骤S4,若全部计算完毕,执行步骤S7;步骤S6:使用结构信息特征融合模块对所有31个图像块的48维结构信息特征H↓[f]进行融合,得到一幅图像的全局结构信息特征H↓[g]=(H↓[f1],...,H↓[f31]);步骤S7:使用分类器训练模块对全局结构信息特征训练,得到第一级分类器;步骤S8:用第一级分类器对场景图像进行分类,得到以概率形式表示的分类结果R↓[1]=(R↓[11],R↓[12],...,R↓[1n]),其中R↓[1i](i∈[1,n])按照从大到小排列,n为场景图像的类别个数;步骤S9:使用相似类别对计算模块统计分类结果R↓[1]中前两个候选的可能情况,即统计(R↓[11],R↓[12])的可能组合,得到N个相似类别对,N∈[1,n(n-1)/2],为了降低后续的计算复杂度,N设为n/5;步骤S10:使用局部纹理特征计算模块针对N个相似类别对进行计算,得到场景图像的局部纹理信息特征;步骤S11:使用分类器训练模块对局部纹理信息特征训练,得到N个第...

【技术特征摘要】

【专利技术属性】
技术研发人员:王春恒程刚肖柏华李心洁
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1