基于多方向上下文信息和稀疏编码模型的图像分类方法技术

技术编号：13034565 阅读：163 留言：0更新日期：2016-03-17 10:42

本发明专利技术公开了一种基于多方向上下文信息和改进的稀疏编码模型的图像分类方法包括如下步骤：步骤一：对于训练样本，采用SIFT特征提取方法得到图像的SIFT特征矩阵后，利用基于筛选的稀疏编码算法得到词汇表，并计算稀疏系数及多尺度最大池化得到图像的多方向上下文特征表达后，将所述特征表达作为支持向量机的输入，训练得到分类器的参数；步骤二：对于测试样本得到样本的SIFT特征矩阵后，利用所述的对应方向的词汇表直接计算稀疏系数并结合多尺度最大池化得到图像的多方向上下文特征，将该特征表达输入分类器得到分类结果。本发明专利技术通过基于筛选的稀疏编码提高计算时间复杂度，且利用图像空间上下文信息提高分类正确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算图像处理的模式识别
，具体涉及一种基于多方向上下文信息和稀疏编码模型的图像分类方法。
技术介绍
在计算机视觉和模式识别领域中，寻找到合适的特征来表达图像在解决分类问题中是非常关键的。近些年，利用视觉词袋模型结合空间金字塔匹配的图像特征表示，再用分类器进行预测分类在目标识别和图像分类方面取得了巨大的进展。视觉词袋模型将图像看做是若干个"视觉单词"的集合，图像中每个单词的出现都是独立的，不依赖与其他单词的出现。该模型的实现步骤包括三个方面：1、将图像分块并提取局部描述子；2、训练得到词汇表并用视觉词袋量化图像特征；3、利用空间金字塔模型表示图像。具体来说，在分块提取特征描述子阶段，首先将图像分割成小块并提取局部块的局部特征描述子，如方向梯度直方图DalaiN等人在2005年的IEEEComputerSociety会议上发表的文章"HistogramsofOrientedGradientsforHumanDetection" 中的 H0G(HistogramsofOrientedGradients)及LoweDG在 2004 发表在International JournalofComputerVision的文章"DistinctiveImageFeaturesfrom Scale-InvariantKeypoints'，中的尺度不变特征SIFT(ScalelnvariantFeatureTransfo rm)等。在训练词汇表阶段，利用整个训练集的所有视觉单词集合构造词汇表。 S.Lazebnik等人在CVP...

【技术保护点】
一种基于多方向上下文信息和改进的稀疏编码模型的图像分类方法，其特征在于，包括如下步骤：步骤一：对于训练样本，提取图像块的SIFT方向特征后，将每个图像块的特征向量分别与其水平向右、垂直向下及对角线方向相邻的特征块合并得到三个方向的特征向量，每个方向分别进行筛选的稀疏编码得到词汇表，再计算稀疏系数及多尺度最大池化得到图像的特征表达后，将三方向的特征矩阵结合形成训练图像的多方向上下文特征表达，将所述特征表达作为支持向量机的输入，训练得到分类器的参数；步骤二：对于测试样本得到样本的SIFT特征矩阵后，利用所述的对应方向的词汇表计算稀疏系数并结合多尺度最大池化得到图像的多方向上下文特征，并将该特征表达输入分类器得到分类结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：申丹飞，曹桂涛，陈伟婷，
申请(专利权)人：华东师范大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人