基于空间金字塔稀疏编码的自然场景多标记分类方法技术

技术编号：12337750 阅读：73 留言：0更新日期：2015-11-18 10:47

本发明专利技术方法公开了一种基于空间金字塔稀疏编码的自然场景多标记分类方法，主要解决现有分类方法对自然场景描述不够完全和分类正确率较低的问题。其实现步骤是：建立自然场景图像多标记类别库；提取它的尺度不变特征SIFT生成稀疏字典D；用稀疏字典对图像进行字典映射，并用空间金字塔和稀疏编码生成多尺度稀疏向量；用多分类支持矢量机分类结果校正排序支持矢量机分类结果，得到自然场景图像的最终分类结果。本发明专利技术采用了多尺度特征、稀疏编码和多标记分类方法，提取了图像的局部信息，丰富了图像的特征信息，对自然场景描述的更为完全，提高了自然场景的分类精度和鲁棒性，可用于自然场景匹配、分类和识别。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图像处理
，特别涉及图像平移、旋转、亮度和尺度变化的自然场景分类方法，具体是一种，可用于图像的自然场景匹配、分类和识别。
技术介绍
在过去的十年里，自然场景图像分类已经成为图像处理领域里一个很重要的技术问题。自然场景图像分类有很广泛的应用，如目标识别与检测、智能车辆或机器人导航等领域。由于自然场景图像类内差异性、照明条件差异性和图像本身尺度差异性较大，使得自然场景图像分类问题仍然较难处理。早期的一些自然场景图像分类方法大多数是应用低层信息建立模型的，这些方法采用全局统计信息，如运用全局的颜色或者纹理特征直方图表示图像。尽管这些方法的时间复杂性较低，但是它们通常应用于人为场景图像和室内场景图像分类，对自然场景的描述不够完全，并且分类结果较差。多标记学习是针对现实世界中普遍存在的多义性对象而提出的一种学习框架。在该学习框架下，每个对象由一个示例描述，该示例具有多个类别标记，学习的目的是将所有合适的类别标记赋予未标记示例。在自然场景分类问题中，图像可能同时隶属于多个类别，例如同一幅图像中，既有"山"也有"树"，或者既有"沙漠"也有"海洋"，而单标记学习只能对图像标记成一种类别，多标记学习可对图像标记成多个类别。该问题可以很自然地利用多标记学习框架进行建模，且描述较完全。目前已经出现了大量的多标记分类方法，并在自然场景分类领域得到了广泛应用。Boutell等人将自然场景多标记分类问题转化为多个独立的二分类问题，并给出了多种预测准则用于从各个二分类的支持矢量机SVM分类器中确定测试样本的类别。该方法...
<a href="http://www.xjishu.com/zhuanli/55/CN105069481.html" title="基于空间金字塔稀疏编码的自然场景多标记分类方法原文来自X技术">基于空间金字塔稀疏编码的自然场景多标记分类方法</a>

【技术保护点】
一种基于空间金字塔稀疏编码的自然场景多标记分类方法，包括如下步骤：(1)建立自然场景图像多标记类别库；(2)对自然场景图像多标记类别库中的每幅图像，提取图像的尺度不变SIFT特征矩阵F：以k像素为步长均匀采样，并提取每个采样点周围16×16像素大小图像块的d维尺度不变特征SIFT，得到图像的SIFT特征矩阵F＝{y1,y2,...,yi,...,yn}∈Rd×n，其中R表示实数集合，yi表示图像的第i个图像块的SIFT特征向量，i＝1,2,…,n，n表示图像中图像块的个数，d表示SIFT特征维数；(3)对所有图像的SIFT特征矩阵，从中随机选取M个特征向量，构成新特征矩阵Y，将其通过K‑奇异值分解方法K‑SVD训练字典D，M取值为100000‑1000000之间的整数；(4)对每幅图像的特征矩阵F，通过已经训练好的字典D进行稀疏编码，得到图像的稀疏矩阵W；(5)对每幅图像的稀疏矩阵W，利用空间金字塔最大池化方法，得到图像的稀疏编码向量X；(6)将每幅图像的稀疏编码向量X分别通过多分类支持矢量机SVM和排序支持矢量机Rank‑SVM进行分类，通过多分类支持矢量机SVM的分类结果为S，通过...

【技术特征摘要】

【专利技术属性】
技术研发人员：焦李成，张丹，马文萍，屈嵘，曾杰，刘红英，王爽，侯彪，杨淑媛，尚荣华，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人