基于空间金字塔稀疏编码的自然场景多标记分类方法技术

技术编号:12337750 阅读:73 留言:0更新日期:2015-11-18 10:47
本发明专利技术方法公开了一种基于空间金字塔稀疏编码的自然场景多标记分类方法,主要解决现有分类方法对自然场景描述不够完全和分类正确率较低的问题。其实现步骤是:建立自然场景图像多标记类别库;提取它的尺度不变特征SIFT生成稀疏字典D;用稀疏字典对图像进行字典映射,并用空间金字塔和稀疏编码生成多尺度稀疏向量;用多分类支持矢量机分类结果校正排序支持矢量机分类结果,得到自然场景图像的最终分类结果。本发明专利技术采用了多尺度特征、稀疏编码和多标记分类方法,提取了图像的局部信息,丰富了图像的特征信息,对自然场景描述的更为完全,提高了自然场景的分类精度和鲁棒性,可用于自然场景匹配、分类和识别。

【技术实现步骤摘要】

本专利技术属于图像处理
,特别涉及图像平移、旋转、亮度和尺度变化的自然 场景分类方法,具体是一种,可用于 图像的自然场景匹配、分类和识别。
技术介绍
在过去的十年里,自然场景图像分类已经成为图像处理领域里一个很重要的技术 问题。自然场景图像分类有很广泛的应用,如目标识别与检测、智能车辆或机器人导航等领 域。由于自然场景图像类内差异性、照明条件差异性和图像本身尺度差异性较大,使得自然 场景图像分类问题仍然较难处理。早期的一些自然场景图像分类方法大多数是应用低层信 息建立模型的,这些方法采用全局统计信息,如运用全局的颜色或者纹理特征直方图表示 图像。尽管这些方法的时间复杂性较低,但是它们通常应用于人为场景图像和室内场景图 像分类,对自然场景的描述不够完全,并且分类结果较差。 多标记学习是针对现实世界中普遍存在的多义性对象而提出的一种学习框架。在 该学习框架下,每个对象由一个示例描述,该示例具有多个类别标记,学习的目的是将所有 合适的类别标记赋予未标记示例。在自然场景分类问题中,图像可能同时隶属于多个类别, 例如同一幅图像中,既有"山"也有"树",或者既有"沙漠"也有"海洋",而单标记学习只能 对图像标记成一种类别,多标记学习可对图像标记成多个类别。该问题可以很自然地利用 多标记学习框架进行建模,且描述较完全。 目前已经出现了大量的多标记分类方法,并在自然场景分类领域得到了广泛应 用。Boutell等人将自然场景多标记分类问题转化为多个独立的二分类问题,并给出了多种 预测准则用于从各个二分类的支持矢量机SVM分类器中确定测试样本的类别。该方法使用 颜色信息(colorinformation)作为特征向量来描述图像,在图像平移、旋转、亮度和尺度 变化时适应性较差,并且存在对自然场景描述不完全的情况。 Zhang和Zhou提出了一种基于懒惰学习(lazylearning)技术的多标记学习算 法--多标记K近邻(ML-KNN),该算法直接使用测试样本与训练样本的相似度来对概念标 记进行预测。该方法也同样使用颜色信息作为特征向量来描述图像,存在适应性较差的问 题。 图像的有效信息除了有颜色信息,还有纹理、轮廓、尺度信息等深层涵义信息。上 述方法在多标记分类问题中均仅使用颜色信息作为特征向量,因此在图像平移、旋转、亮度 和尺度变化时很难获得图像的完整正确分类。
技术实现思路
本专利技术的目的在于针对上述现有技术方法的不足,提出了一种基于空间金字塔稀 疏编码的自然场景多标记分类方法,以减少由于图像平移、旋转、亮度和尺度变化带来的误 分,且该方法对于光线、噪声、微视角改变、部分物体遮蔽的容忍度也相当高,提高了自然场 景多标记分类的正确率和鲁棒性。 为实现上述目的,本专利技术的技术方案包括如下步骤: (1)建立自然场景图像多标记类别库; (2)对自然场景图像多标记类别库中的每幅图像,提取图像的尺度不变SIFT特征 矩阵F: 以k像素为步长均匀采样,并提取每个采样点周围16X16像素大小图像块的d维 尺度不变特征SIFT,得到图像的SIFT特征矩阵F= {yi,y2,…,yi,…,yn}GRdxn,其中R表 示实数集合,表示图像的第i个图像块的SIFT特征向量,i= 1,2,…,n,n表示图像中 图像块的个数,d表示SIFT特征维数; (3)对所有图像的SIFT特征矩阵,从中随机选取M个特征向量,构成新特征矩阵 Y,将其通过K-奇异值分解方法K-SVD训练字典D,M取值为100000-1000000之间的整数; (4)对每幅图像的特征矩阵F,通过已经训练好的字典D进行稀疏编码,得到图像 的稀疏矩阵W; (5)对每幅图像的稀疏矩阵W,利用空间金字塔最大池化方法,得到图像的稀疏编 码向量X; (6)将每幅图像的稀疏编码向量X分别通过多分类支持矢量机SVM和排序支持矢 量机Rank-SVM进行分类,通过多分类支持矢量机SVM的分类结果为S,通过排序支持矢量机 Rank-SVM的分类结果为R: (6a)把图像的稀疏编码向量X输入到多分类支持矢量机SVM中,通过一对多的正 项准则策略,经过训练、测试,得到图像的分类结果S=以,S2,…,S1,…,S丄其中S1表示 在该分类策略中第i幅图像的分类结果,m表示测试图像的总数;(6b)把图像的稀疏编码向量X输入到排序支持矢量机Rank-SVM中,经过训练、测 试,得到图像的分类结果R=取,R2,…,R1,…,RnJ,其中民表示在该分类策略中第i幅图 像的分类结果; (7)通过多分类支持矢量机SVM的分类结果S辅助校正排序支持矢量机Rank-SVM 的分类结果R,得到自然场景图像多标记类别库中图像的最终分类结果C: 多分类SVM的分类结果S= (S1,S2,…,S1,…,SJ中找到非零向量的位置为j,j =1,2,. .m,用位置为j的非零向量Sj替换Rank-SVM的分类结果R={RuR2,…,R1,…,RJ 中对应位置j的向量R,,得到自然场景图像多标记类别库中图像的最终分类结果C= (R1,R2,…,Sj,…,R1J,其中Sj为替换向量Rj的非零向量。 本专利技术与现有的技术相比具有以下优点: 本专利技术首先输入自然场景图像多标记类别库中的图像,提取它的尺度不变特征 SIFT。其次,用K-奇异值分解方法K-SVD对初始字典进行学习得到稀疏字典D,利用空间金 字塔最大池化方法和稀疏字典对图像进行稀疏编码。最后,通过多标记分类方法和判定准 则对自然场景图像进行分类。本专利技术在不限制分类类别数目的同时,有效地提高了自然场 景图像的分类精度和鲁棒性,并且有效的利用了图像的局部信息。与现有的技术相比,本发 明具有以下优点: 1、本专利技术提取了自然场景图像的SIFT特征,其作为图像特征有效地获取了图像 的局部信息,能适应图像平移、旋转、亮度和尺度变化带来的影响; 2、本专利技术利用K-SVD算法得到较好的稀疏字典,使分类结果有更好的鲁棒性; 3、本专利技术利用多分类支持矢量机SVM和排序支持矢量机Rank-SVM进行分类,并利 用多分类支持矢量机SVM的分类结果辅助校正排序支持矢量机Rank-SVM的分类结果,使得 最终的分类结果准确率更高,分类鲁棒性更好。【附图说明】 图1是本专利技术的实现流程图;图2是本专利技术仿真采用的自然场景图像多标记类别库中的样例图像。【具体实施方式】 以下结合附图对本专利技术的实施例和效果作进一步详细描述:图像分类问题是图像处理
中重要的分支,图像分类问题中普遍存在着一 幅图像对应多个类别的情况,图像分类要解决的问题不仅是按照以图为单位进行分类,也 要以图的种类进行标注。图像分类可应用于目标识别与检测、智能车辆或机器人导航等领 域。目前对于自然场景图像多标记分类方法还存在图像特征提取不充分的问题。本专利技术是 在这一
进行的研究。 实施例1 本专利技术是一种。参照图1,本 专利技术的具体实施步骤如下: 步骤1,建立自然场景图像多标记类别库,将图像作为输入数据。 将自然场景图像多标记类别库original作为本专利技术实验使用图像库,该图像库 包含2000幅自然场景图像,所有可能的概念标记为沙漠、山、海洋、落日和树,每幅图像被 人工标注了一组概念标记集合。具有两个或两个以上概念标记(本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/CN105069481.html" title="基于空间金字塔稀疏编码的自然场景多标记分类方法原文来自X技术">基于空间金字塔稀疏编码的自然场景多标记分类方法</a>

【技术保护点】
一种基于空间金字塔稀疏编码的自然场景多标记分类方法,包括如下步骤:(1)建立自然场景图像多标记类别库;(2)对自然场景图像多标记类别库中的每幅图像,提取图像的尺度不变SIFT特征矩阵F:以k像素为步长均匀采样,并提取每个采样点周围16×16像素大小图像块的d维尺度不变特征SIFT,得到图像的SIFT特征矩阵F={y1,y2,...,yi,...,yn}∈Rd×n,其中R表示实数集合,yi表示图像的第i个图像块的SIFT特征向量,i=1,2,…,n,n表示图像中图像块的个数,d表示SIFT特征维数;(3)对所有图像的SIFT特征矩阵,从中随机选取M个特征向量,构成新特征矩阵Y,将其通过K‑奇异值分解方法K‑SVD训练字典D,M取值为100000‑1000000之间的整数;(4)对每幅图像的特征矩阵F,通过已经训练好的字典D进行稀疏编码,得到图像的稀疏矩阵W;(5)对每幅图像的稀疏矩阵W,利用空间金字塔最大池化方法,得到图像的稀疏编码向量X;(6)将每幅图像的稀疏编码向量X分别通过多分类支持矢量机SVM和排序支持矢量机Rank‑SVM进行分类,通过多分类支持矢量机SVM的分类结果为S,通过排序支持矢量机Rank‑SVM的分类结果为R:(6a)把图像的稀疏编码向量X输入到多分类支持矢量机SVM中,通过一对多的正项准则策略,经过训练、测试,得到图像的分类结果S={S1,S2,…,Si,…,Sm},其中Si表示在该分类策略中第i幅图像的分类结果,m表示测试图像的总数;(6b)把图像的稀疏编码向量X输入到排序支持矢量机Rank‑SVM中,经过训练、测试,得到图像的分类结果R={R1,R2,…,Ri,…,Rm},其中Ri表示在该分类策略中第i幅图像的分类结果;(7)通过多分类支持矢量机SVM的分类结果S辅助校正排序支持矢量机Rank‑SVM的分类结果R,得到自然场景图像多标记类别库中图像的最终分类结果C:多分类SVM的分类结果S={S1,S2,…,Si,…,Sm}中找到非零向量的位置为j,j=1,2,..m,用位置为j的非零向量Sj替换Rank‑SVM的分类结果R={R1,R2,…,Ri,…,Rm}中对应位置j的向量Rj,得到自然场景图像多标记类别库中图像的最终分类结果C={R1,R2,…,Sj,…,Rm},其中Sj为替换向量Rj的非零向量。...

【技术特征摘要】

【专利技术属性】
技术研发人员:焦李成张丹马文萍屈嵘曾杰刘红英王爽侯彪杨淑媛尚荣华
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1