基于多方向上下文信息和稀疏编码模型的图像分类方法技术

技术编号:13034565 阅读:163 留言:0更新日期:2016-03-17 10:42
本发明专利技术公开了一种基于多方向上下文信息和改进的稀疏编码模型的图像分类方法包括如下步骤:步骤一:对于训练样本,采用SIFT特征提取方法得到图像的SIFT特征矩阵后,利用基于筛选的稀疏编码算法得到词汇表,并计算稀疏系数及多尺度最大池化得到图像的多方向上下文特征表达后,将所述特征表达作为支持向量机的输入,训练得到分类器的参数;步骤二:对于测试样本得到样本的SIFT特征矩阵后,利用所述的对应方向的词汇表直接计算稀疏系数并结合多尺度最大池化得到图像的多方向上下文特征,将该特征表达输入分类器得到分类结果。本发明专利技术通过基于筛选的稀疏编码提高计算时间复杂度,且利用图像空间上下文信息提高分类正确率。

【技术实现步骤摘要】

本专利技术涉及计算图像处理的模式识别
,具体涉及一种基于多方向上下文 信息和稀疏编码模型的图像分类方法。
技术介绍
在计算机视觉和模式识别领域中,寻找到合适的特征来表达图像在解决分类问题 中是非常关键的。近些年,利用视觉词袋模型结合空间金字塔匹配的图像特征表示,再用分 类器进行预测分类在目标识别和图像分类方面取得了巨大的进展。视觉词袋模型将图像看 做是若干个"视觉单词"的集合,图像中每个单词的出现都是独立的,不依赖与其他单词的 出现。该模型的实现步骤包括三个方面:1、将图像分块并提取局部描述子;2、训练得到词 汇表并用视觉词袋量化图像特征;3、利用空间金字塔模型表示图像。 具体来说,在分块提取特征描述子阶段,首先将图像分割成小块并提取局部块的 局部特征描述子,如方向梯度直方图DalaiN等人在2005年的IEEEComputerSociety会议上发表的文章"HistogramsofOrientedGradientsforHumanDetection" 中的 H0G(HistogramsofOrientedGradients)及LoweDG在 2004 发表在International JournalofComputerVision的文章"DistinctiveImageFeaturesfrom Scale-InvariantKeypoints',中的尺度不变特征SIFT(ScalelnvariantFeatureTransfo rm)等。 在训练词汇表阶段,利用整个训练集的所有视觉单词集合构造词汇表。 S.Lazebnik等人在CVPR2006 发表的文章"Beyondbagsoffeatures:Spatialpyramid matchingforrecognizingnaturalscenecategories',中米用k-means算法构造词汇 表,是基于样本间相似度度量将词义相近的词汇合并,作为词汇表中的基础词汇。接着利用 视觉词袋量化图像特征,统计词汇表中每个单词出现的次数得到每幅图像的直方图特征表 示。但是k-means算法中每个视觉词汇仅和词汇表中一个单词相关联,因此在重建误差和 表示正确性方面表现较差。稀疏编码算法分为词汇表训练阶段和稀疏表示两个阶段,在词 汇训练阶段寻找一组"超完备"基向量,对于一组输入向量,稀疏系数不再由唯一的视觉词 汇表示,而是由尽可能少的几个远大于零的系数表示,最终一幅图像将由一个稀疏矩阵表 不。 S.Lazebnik等人提出的空间金字塔匹配模型是将图像分为不同的尺度下的若干 个块,统计多尺度特征作为图像的最终表示即分类器的输入。K-means与空间金字塔结合 的过程是将各个尺度下的直方图特征串联起来得到图像的多尺度表示。J.Yang等在CVPR 2009 发表的论文"LinearSpatialPyramidMatchingusingSparseCodingforImage Classification"将稀疏编码与空间金字塔模型的结合。该算法将图像分为多个尺度,在每 个对应图像块做maxpooling,最终将多尺度最大池化的空间金字塔模型特征串联得到图 像的最终特征。胡正平等人提出多方向上下文特征与k-means聚类结合的自然场景图像分 类算法,该方法在得到三方向的视觉词汇表后,将词汇表连接形成最终的视觉词汇表,利用 该词汇表计算聚类标签及空间金字塔矩阵。尽管视觉词袋模型结合空间金字塔匹配在图像分类应用中取得了很大的进步,但 是在时间复杂度和识别效率方面还有很大的提升空间。因此,针对以上两方面的缺陷,本发 明提出了一种基于多方向上下文信息和稀疏编码模型的图像分类算法。
技术实现思路
本专利技术提出了一种基于多方向上下文信息和改进的稀疏编码模型的图像分类方 法,包括如下步骤: 步骤一:对于训练样本,提取图像块的SIFT方向特征后,将每个图像块的特征向 量与其水平向右、垂直向下及对角线方向相邻的特征块合并得到三个方向的特征向量,每 个方向分别进行筛选的稀疏编码得到词汇表,再计算稀疏系数及多尺度最大池化得到图像 的特征表达后,将三方向的特征矩阵结合形成训练图像的最终特征表达一一多方向上下文 特征表达,将所述特征表达作为支持向量机的输入,训练得到分类器的参数; 步骤二:对于测试样本得到样本的SIFT特征矩阵后,利用所述的对应方向的词汇 表直接计算稀疏系数并结合多尺度最大池化得到图像的多方向上下文特征,并将该特征表 达输入分类器得到分类结果。 本专利技术提出的所述基于多方向上下文信息和改进的稀疏编码模型的图像分类方 法中,得到稀疏编码的词汇表的方法包括如下步骤: 步骤A1 :建立优化的目标函数,所述目标函数的变量包含词汇表和稀疏系数; 步骤A2 :固定词汇表,调整稀疏系数使得目标函数的值直至最小值; 步骤A3 :固定稀疏系数,调整词汇表使得所述目标函数的值直至最小值; 步骤A4 :重复步骤A2和步骤A3,使得目标函数的的值收敛至最小值,此时获得所 述系数编码的词汇表。本专利技术提出的所述基于多方向上下文信息和改进的稀疏编码模型的图像分类方 法中,其特征在于,所述多方向上下文特征表达的获取方法包括如下步骤: 步骤B1 :将输入图像均匀划分为至少一个子块,对每个子块提取局部SIFT特征, 将每个子块分别与其水平相邻的子块相结合形成水平超级块,与其垂直相邻的子块相结合 形成垂直超级块,与其对角线相邻的子块相结合形成对角线超级块,并将当前子块的SIFT 特征向量与所述水平超级块、所述垂直超级块和所述对角线超级块对应的子块的SIFT特 征向量串联分别得到三方向信息特征:水平方向特征向量、垂直方向特征向量和对角线方 向特征向量; 步骤B2 :将所述三方向信息特征的矩阵,分别利用筛选的稀疏编码算法,通过DDP 规则筛选出稀疏系数分量为零的项,并将对应单词从所述词汇表中剔除,利用剔除后的词 汇表计算稀疏系数,得到三个方向的方向稀疏编码: 步骤B3 :利用多尺度最大池化空间金字塔模型形成输入图像的三个稀疏表示; 步骤Μ:将所述稀疏表示相结合形成输入图像的多方向上下文特征表达。 本专利技术提出的所述基于多方向上下文信息和改进的稀疏编码模型的图像分类方 法中,所述DDP规则的过程如下:当固定词汇表后,计算稀疏系数的过程实际上是求解输入 向量与稀疏系数间的Lasso问题的过程,所述Lasso问题的对偶问题是关于输入向量与对 偶变量的求解问题。根据KKT条件,Lasso问题与其对偶问题的优化结果间存在一定关系, 即当对偶结果与词汇表第m个向量乘积属于开区间(-1,1)之间时,则稀疏系数的第m维系 数为0。根据所述DDP规则,可将稀疏系数为0的对应词汇从词汇表剔除,形成一个缩小的 词汇表。 本专利技术提出的所述基于多方向上下文信息和改进的稀疏编码模型的图像分类方 法中,将所述多方向上下文特征表达输入分类器后进行分类的步骤包括:对于训练样本,采 用one-against-all方式进行训练,得到SVM分类器模型参数;对于测试样本,利用训练好 的模型测试得到分类结果。由于所述多方向上下文特征充分利用图像块之间的上下文信 息,并且是经过多次特征转换得到的特征,故其有效的改善了分类效果。 本发本文档来自技高网
...

【技术保护点】
一种基于多方向上下文信息和改进的稀疏编码模型的图像分类方法,其特征在于,包括如下步骤:步骤一:对于训练样本,提取图像块的SIFT方向特征后,将每个图像块的特征向量分别与其水平向右、垂直向下及对角线方向相邻的特征块合并得到三个方向的特征向量,每个方向分别进行筛选的稀疏编码得到词汇表,再计算稀疏系数及多尺度最大池化得到图像的特征表达后,将三方向的特征矩阵结合形成训练图像的多方向上下文特征表达,将所述特征表达作为支持向量机的输入,训练得到分类器的参数;步骤二:对于测试样本得到样本的SIFT特征矩阵后,利用所述的对应方向的词汇表计算稀疏系数并结合多尺度最大池化得到图像的多方向上下文特征,并将该特征表达输入分类器得到分类结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:申丹飞曹桂涛陈伟婷
申请(专利权)人:华东师范大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1