一种基于稀疏编码特征提取的场景识别方法技术

技术编号:19058832 阅读:36 留言:0更新日期:2018-09-29 12:33
本发明专利技术涉及图像识别技术领域,特别涉及一种基于稀疏编码特征提取的场景识别方法。一种基于稀疏编码特征提取的场景识别方法,包括步骤:对预先采集的用于训练的样本图像集进行预处理操作;提取样本图像集的特征表达向量;将特征表达向量及其对应的类别标注加入线性分类器中,构建线性场景分类器;对待识别的样本图像集进行预处理操作;提取待识别的样本图像集的特征表达向量;将待识别的样本图像集的特征表达向量送入线性场景分类器中识别,获得样本图像集的所属场景类的类别标注。采用稀疏编码技术可以在降低图像维度的同时保留图像的主要信息,同时对噪声及遮挡具有强大的鲁棒性。

【技术实现步骤摘要】
一种基于稀疏编码特征提取的场景识别方法
本专利技术涉及图像识别
,特别涉及一种基于稀疏编码特征提取的场景识别方法。
技术介绍
场景识别指的是按照场景图像相近的内容如相同颜色特征识别出场景图片中的场景,目的是通过模仿人类的感知能力来挖掘图像中的场景特征,从而自动地识别出图像所隶属的场景。在场景识别过程中,整个图像是作为一个整体被判别的,并不涉及具体目标。因为具体目标只能作为场景分类中判定所属类别的一个依据,但与场景所属类别却不一定完全相关。场景识别是计算机视觉和机器人领域中一个基础的预处理过程,它在图像内容检索、模式识别和机器学习等的计算机智能领域中担任重要的角色。近几年来,场景识别研究已取得了较大进展,涌现出很多场景类别建模的方法。根据场景类别建模方式将现有场景识别方法分成四类:(1)基于全局特征的场景识别方法基于全局特征的场景识别方法大多通过颜色、纹理和形状等图像的全局可视化特征来对场景进行描述,并成功应用于室外场景识别中。相比而言,颜色特征对于场景的尺度、视角的变化以及图像的旋转均能取得更好的识别结果;而纹理与形状特征对应于图像的结构和方向信息,这些恰好也是人类视觉系统所敏感的,因此纹理与形状特征与人类的视觉感知结果具有更好的一致性。然而,基于全局特征的场景识别方法通常需要搜索图像的所有像素点,且没有考虑像素点的空间位置关系,因此它具有较差的实时性和通用性。(2)基于目标的场景识别方法一个特定地点可以通过其周围一系列极具代表性的目标来准确地定位,基于此原理,大多数场景识别方法也是根据图像中目标识别的结果来辨识出图像所对应的场景。于是,该类场景识别方法需要经历图像分割、多特征组合和目标识别等阶段。当待识别的目标距离视角很远时,该目标就很有可能隐藏在那些缺乏分析价值的背景信息中,在分割阶段就己经被忽略掉了,进而导致该目标识别工作无法实现。除此之外,为了简化具体场景的复杂度,需要选取一组能够代表该场景的目标,而这些可靠且稳定的代表性目标的选取问题成为了制约基于目标的场景识别的另一个瓶颈。(3)基于区域的场景识别方法鉴于基于目标的场景识别方法所具有的局限性,一些研究者利用分割得到的区域来代替场景代表性目标,并根据这些区域的结构关系进行特征组合从而形成场景标示。该类场景识别方法的关键在于如何得到可信赖的区域分割算法。而这些区域信息的特征表示方法有很多,例如:可以采用局部与全局相结合的方式来实现,即提取区域内部的全局统计特征;也可以通过提取区域中的局部不变特征来对区域进行表征;还可以根据词袋模型来对区域信息进行表征。(4)基于仿生特征的场景识别方法考虑到场景识别的实时性与高效性,目前最好的计算机视觉系统与人类以及其他动物的视觉系统之间仍然存在着无法弥补的差距。鉴于人和动物所具有的优越的场景识别能力,随之产生了基于仿生特征的场景识别方法,该方法通过模拟生物视皮层的处理机制来实现场景识别。其基本思路是针对某一种生物视觉机制或某一类生物视觉特性展开研究,并通过细致的分析来建立有效的计算模型,从而获取令人满意的结果。例如,基于人类视觉注意力选择机制的方法可以将某些容易引起人注意的图像区域信息作为优先处理对象,这种选择性的机制能够极大地提高场景识别方法对视觉信息的处理、分析与识别的效率。现有场景识别中存在的各项难点,如同一场景是动态变化的、同一场景的图片存在多变性、不同的类之间的图像可能会有很多相似的点、不同场景的图像可能会出现重叠的情况和场景分类的分类性能很大因素上依赖于训练场景图像类别标注的精确度等,所有这一切都会导致场景分类识别的精确度不高。
技术实现思路
为此,需要提供一种基于稀疏编码特征提取的场景识别方法,用以解决场景分类识别精确度不高的问题。为实现上述目的,专利技术人提供了一种基于稀疏编码特征提取的场景识别方法,具体技术方案如下:一种基于稀疏编码特征提取的场景识别方法,包括步骤:对预先采集的用于训练的样本图像集进行预处理操作;提取所述预处理操作后的样本图像集的特征表达向量;将所述样本图像集的特征表达向量及其对应的类别标注加入线性分类器中,对所述线性分类器进行参数学习获得线性分类器的最佳参数,根据所述最佳参数构建线性场景分类器;对待识别的样本图像集进行预处理操作;提取所述预处理操作后的待识别的样本图像集的特征表达向量;将所述预处理后的待识别的样本图像集的特征表达向量送入所述线性场景分类器中识别,获得所述待识别的样本图像集的所属场景类的类别标注。进一步的,所述预处理操作包括:图像对比度归一化及Gamma校正处理。进一步的,所述“提取所述预处理操作后的样本图像集的特征表达向量”,包括:采用多尺度SIFT特征融合的方法提取预处理操作后的样本图像集的底层特征,即对每个像素点采用多种尺度大小的领域,在每个领域内提取图像的SIFT关键点,并求解所述SIFT关键点的稀疏表达,采用空间金字塔策略及max-pooling形成预处理后的样本图像集的特征表达向量。进一步的,所述步骤“求解所述SIFT关键点的稀疏表达”,包括:采用局部线性约束编码求解所述SIFT关键点的稀疏表达。进一步的,所述步骤“并采用空间金字塔策略及max-pooling形成预处理操作后的样本图像集的特征表达向量”,包括:将图像划分成1×1、1×4及4×1的局部区域,在局部区域内采用max-pooling统计编码特征的直方图,形成所述局部区域的特征表达,连接所有区域的特征表达形成预处理操作后的样本图像集的特征表达向量。进一步的,所述步骤“对所述线性分类器进行参数学习获得线性分类器的最佳参数”,包括:采用最小二乘法计算得到线性分类器的权重参数,并采用交叉验证法得到线性分类器最佳参数。进一步的,所述“图像对比度归一化”包括步骤:将图像从RGB颜色空间转到YUV颜色空间、对YUV颜色空间进行全局和局部对比归一化处理;所述全局和局部对比归一化处理过程只对Y通道进行操作,其它两个通道保持不变,所述全局归一化是将图像像素值归一化到图像像素均值附近,所述局部归一化是对边缘进行加强。进一步的,所述“提取所述预处理操作后的待识别的样本图像集的特征表达向量”,包括:提取预处理后的待识别的样本图像集的底层特征,并采用多尺度SIFT特征融合;采用多尺度SIFT特征融合的方法提取预处理操作后的样本图像集的底层特征,即对每个像素点采用多种尺度大小的领域,在每个领域内提取图像的SIFT关键点,并求解所述SIFT关键点的稀疏表达,采用空间金字塔策略及max-pooling形成预处理后的样本图像集的特征表达向量。本专利技术的有益效果是:1、本专利技术的方法是基于全局特征的场景识别,整个场景图像作为一个整体被判断,并不涉及具体目标。且在提取样本图像集的底层特征时,采用多尺度SIFT特征融合,可以增加SIFT关键点的个数,同时还能增加图像的局部细节信息。2、采用稀疏编码技术可以在降低图像维度的同时保留图像的主要信息,同时对噪声及遮挡具有强大的鲁棒性。底层稀疏编码特征表达结合max-pooling方法可以降低上层分类器模型的复杂度,加快分类器训练的速度。且稀疏编码是一种非线性的特征映射方式,采用该种特征映射方式可有效提高后续的分类性能。3、预处理操作采用对比度归一化及Gamma校正相结合,可显著减轻由本文档来自技高网
...

【技术保护点】
1.一种基于稀疏编码特征提取的场景识别方法,其特征在于,包括步骤:对预先采集的用于训练的样本图像集进行预处理操作;提取所述预处理操作后的样本图像集的特征表达向量;将所述样本图像集的特征表达向量及其对应的类别标注加入线性分类器中,对所述线性分类器进行参数学习获得线性分类器的最佳参数,根据所述最佳参数构建线性场景分类器;对待识别的样本图像集进行预处理操作;提取所述预处理操作后的待识别的样本图像集的特征表达向量;将所述预处理后的待识别的样本图像集的特征表达向量送入所述线性场景分类器中识别,获得所述待识别的样本图像集的所属场景类的类别标注。

【技术特征摘要】
1.一种基于稀疏编码特征提取的场景识别方法,其特征在于,包括步骤:对预先采集的用于训练的样本图像集进行预处理操作;提取所述预处理操作后的样本图像集的特征表达向量;将所述样本图像集的特征表达向量及其对应的类别标注加入线性分类器中,对所述线性分类器进行参数学习获得线性分类器的最佳参数,根据所述最佳参数构建线性场景分类器;对待识别的样本图像集进行预处理操作;提取所述预处理操作后的待识别的样本图像集的特征表达向量;将所述预处理后的待识别的样本图像集的特征表达向量送入所述线性场景分类器中识别,获得所述待识别的样本图像集的所属场景类的类别标注。2.根据权利要求1所述的一种基于稀疏编码特征提取的场景识别方法,其特征在于,所述预处理操作包括:图像对比度归一化及Gamma校正处理。3.根据权利要求1所述的一种基于稀疏编码特征提取的场景识别方法,其特征在于,所述“提取所述预处理操作后的样本图像集的特征表达向量”,包括:用多尺度SIFT特征融合的方法来提取样本图像集的底层特征,即对每个像素点采用多种尺度大小的领域,在每个领域内提取图像的SIFT关键点;求解所述SIFT关键点的稀疏表达,并采用空间金字塔策略及max-pooling形成预处理后的样本图像集的特征表达向量。4.根据权利要求3所述的一种基于稀疏编码特征提取的场景识别方法,其特征在于,所述步骤“求解所述SIFT关键点的稀疏表达”,包括:采用局部线性约束编码求解所述SIFT关键点的稀疏表达。5.根据权利要求3所述的一种基于稀疏编码特征提取的场景识别方法,其特征在于,...

【专利技术属性】
技术研发人员:曾伟波苏江文郑耀松吕君玉林吓强陈铠
申请(专利权)人:福建亿榕信息技术有限公司国网信息通信产业集团有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1