当前位置: 首页 > 专利查询>重庆大学专利>正文

一种快速局部约束低秩编码的图像分类方法技术

技术编号:12577452 阅读:114 留言:0更新日期:2015-12-23 17:05
本发明专利技术公开了一种快速局部约束低秩编码的图像分类方法,该方法分字典学习部分、训练部分和测试部分。字典学习部分是根据数据集提取的所有SIFT特征学运用到k-menas方法聚类或其他字典学习方法得到相应的字典。训练部分选取每个数据集每类中的部分图像作为训练图像,然后针对这些图像的标签学习每个类别对应的低秩表示,经过SPM量化得到经过SVM分类训练得到类别标签和特征表示矩阵对应的核函数。测试部分以每个数据库中剩余的所有图像作为待分类的测试图像,针对任意一张不知类别的图像,首先提取SIFT特征,然后求得其在字典下的低秩编码矩阵,经过SPM量化得到最终的特征表示矩阵,将其输入训练部分得到的SVM分类器,从而得到该图像所属类别。

【技术实现步骤摘要】

本专利技术涉及一种利用快速局部约束低秩编码的方法进行图像分类,此方法快速并 精度较高,是一种基于图像内容的数据驱动的分类方法。
技术介绍
图像分类属于计算机视觉的一个重要研究方向,它包括图像的预处理,特征的表 达与分类器的设计,其中特征表达包括图像特征的提取、特征的降维和特征的编码。特征提 取主要是通过图像中各种内容表现出来的颜色、亮度、纹理、形状及像素的空间分布等属性 对图像描述。特征表达式指在最基本的特征基础上进行统计(矢量量化)、编码或其他方法 以形成一幅图像最后的特征,通常情况下会比原始的基本特征具有更好的性能;良好的特 征表达能够提升图像分类和识别的性能。 近几年对于特征描述表示的方法比较多,有视觉词包模型(bag of words,B0W)、 基于稀疏编码的空间金字塔模型(Sparse Coding Spatial Pyramid Matching,ScSPM)、 局部约束线性编码(Locality-constrained Linear Coding,LLC)、结构低秩表示的图像分 类方法(Structured Low-rank Representation, SLRR)和低秩稀疏分解的图像分类方法 (Low-rank Sparse Coding,LRSC),这些方法在一定程度上克服了一些难题,不过依然都存 在不足。 视觉词包模型(bag of words,B0W)虽然易于构建,但忽略了同类图像具有一定 的空间结构相似性。基于稀疏编码的空间金字塔模型(Sparse Coding Spatial Pyramid Matching,ScSPM)忽略了局部描述子之间的相关性,而且对特征的变化和噪声敏感,而且 计算量很大,耗内存。局部约束线性编码(Locality-constrained Linear Coding,LLC), 这种局部性一定程度上导致了稀疏性,相对于稀疏编码使得算法的运算量大大减小,速度 提高,但LLC忽略了特征之间的整体结构化特征的空间信息。结构低秩表示的图像分类 方法(Structured Low-rank Representation, SLRR),对人脸识别有较好的效果,尤其适 用于有严重噪声(如遮挡、光照角度变化等)的图像分类。低秩稀疏分解的图像分类方 法(Low-rank Sparse Coding) (LRSC)分类精度得到了一定提高,但还是忽略了局部空间 信息;其中稀疏部分对编码仍然很敏感。基于空间金字塔的快速低秩表示的图像分类方法 (Fast Low-rank Representation based Spatial Pyramid Matching, LrrSPM),此方法的 分类速度是ScSPM的5~16倍,但是分类精度低于ScSPM和LLC方法。 目前图像分类方法大都采用稀疏编码和低秩表示的编码方式,但是鉴于稀疏编码 对图像的变化和噪声较敏感,非常耗内存;采用低秩表示的编码方式在精度和计算复杂度 间得到一个平衡。
技术实现思路
鉴于目前分类方法在分类效果及分类速度方面的缺陷,本专利技术提出一种快速局部 约束低秩编码的图像分类方法,该方法包括字典学习部分,训练部分和测试部分三个部分。 字典学习部分要求对图像库内所有图像提取图像的SIFT特征,经过K-means聚类得到字 典;训练部分首先对训练集中的图像提取SIFT特征,然后求得SIFT特征在字典下的特征编 码表示,采用局部约束的低秩编码方法,同时考虑图像的全局结构一致性和局部空间相似 性,得到特征编码矩阵,经过空间金字塔匹配核、池化后得到最终的特征表示矩阵,采用SVM 方法对特征表示矩阵和类标记进行训练,建立分类模型。测试部分首先对任意一张图像进 行特征提取,然后求得在其字典下编码矩阵,经过空间金字塔匹配核、池化得到特征表示矩 阵后,输入训练得到的SVM分类器,得到该图像所属的分类结果。 为实现本专利技术目的而采用的技术方案是这样的,一种快速局部约束低秩编码的图 像分类方法,包括字典学习部分、训练部分和测试部分。 所述字典学习部分步骤过程如下: 1)利用SIFT特征提取方法对图像库所有图像进行局部特征提取,得到输入特征 向量矩阵X = [XdX2,…,xj e Rmxn,其中Xie Rn是特征向量矩阵的第i个分量向量,其 中m为向量的维数,η为向量个数。 2)利用K-means方法聚类或者其他字典学习方法,对所有图像提取的特征向量矩 阵X进行聚类处理,得到过完备字典D= GRmxk,其中m是字典的维数,k为 字典基的数目,满足字典过完备性m << k,k通常为256,1024, 4096等。 所述训练部分步骤过程如下: i)从图像库中选取部分图像作为训练图像,利用SIFT特征提取方法对所有训 练图像进行局部特征提取,得到输入特征向量矩阵X' = eRmXn。其中Xl' e Rn是特征向量矩阵的第i个分量向量,其中m为向量的维数,n为向量个数。 ii)计算每个特征向量X1和字典向量之间的欧式距离P i,计算公式如下: dist (xj,D) = T,dist (xj,(Ii)是特征向量 X;' 与每一个字典向量山间的欧式距离,σ是调整局部约束速度的权重。 iii)计算局部约束低秩编码的特征表示向量Ζ,计算公式为: 其中λ1; λ2>〇是权重;Ρι为上述步骤ii计算得到的欧氏距离Ρι。 iv)对得到的特征表示向量Z采用空间金字塔匹配方法进行处理,将Z分成21 X 21块,其中1 = 1,2, 4,分别代表不同的三层对应的空间金字塔分块的个数。然后针对每层中 每个字块的Zi进行最大池化,即z ; = max{ I z H I,I z2i I,…,I Zm I },得到最终的低秩编码的第 i向量Z1,其中Z]1是第j块中的第i个元素 ,j = 2 1XS1,通过这个过程得到最后的特征表 示矩阵Z'。 V)将特征表示矩阵Z'输入SVM分类器,根据每类图像类别标签和其对应的特征表 示矩阵Z',学习得到SVM分类器的核函数。 所述测试部分步骤过程如下: I)对图像库中剩余的所有图像提取SIFT特征,得到输入特征向量矩阵X* = e Rmxn,其中Xi* e Rn是特征向量矩阵的第i个分量向量。 II)计算每个特征向量X1*和字典向量之间的欧式距离P1,计算公式如下: dist (Xi*, D) = T,dist (Xi*, (Ii)是特征向量 Xi* 与每一个字典向量山间的欧式距离,σ是调整局部约束速度的权重。 III)计算局部约束低秩编码的特征表示向量Ζ*,计算公式为: 其中λ λ 2>〇是权重;p ^为上述步骤II计算得到的欧氏距离。 IV)采用空间金字塔匹配方法,将特征表示向量Ζ*分成21 X 2?,其中1 = 1,2, 4, 分别代表不同的三层对应的空间金字塔分块的个数。然后针对每层中每个字块的Z1*进行 最大池化,保持特征表示向量具有一定的鲁棒性,即Zi* = maXl^Zdl, |z2i*|,…,|ζμ*|}, 得到最终的低秩编码的第i向量Z1*,其中Ζ]1*是第j块中的第i个元素 ,j = S1XS1,这样 得到最后的特征表示矩阵Z*'。 V)将特征表示矩阵Z*本文档来自技高网
...

【技术保护点】
一种快速局部约束低秩编码的图像分类方法,其特征在于:包括字典学习部分、训练部分和测试部分;所述字典学习部分包括以下步骤过程;1)利用SIFT特征提取方法对图像库所有图像进行局部特征提取,得到输入特征向量矩阵X=[x1,x2,…,xn]∈Rm×n;其中xi∈Rn是特征向量矩阵的第i个分量向量,m为向量的维数,n为向量个数;2)利用K‑means方法聚类或者其他字典学习方法,对所有图像提取的特征向量矩阵X进行聚类处理,得到过完备字典D=[d1,d2,…,dk]∈Rm×k;其中m是字典的维数,k为字典基的数量;所述训练部分包括以下步骤过程;i)从图像库中选取部分图像作为训练图像,利用SIFT特征提取方法对所有训练图像进行局部特征提取,得到输入特征向量矩阵X'=[x1',x2',…,xn']∈Rm×n;其中xi'∈Rn是特征向量矩阵的第i个分量向量,其中m为向量的维数,n为向量个数;ii)计算每个特征向量xi'和字典向量D之间的欧式距离pi,计算公式如下:pi=exp(dist(xi′,D)σ)]]>dist(xi',D)=[dist(xi',d1),…,dist(xi',dk)]T,dist(xi',di)是特征向量xi'与每一个字典向量di间的欧式距离;σ是调整局部约束速度的权重;iii)计算局部约束低秩编码的特征表示向量Z,计算公式为:Z=(λ1I+DDT+λ1λ2Σi=1kpiTpi)-1DTX′]]>其中λ1,λ2>0是权重,I为单位向量,Z=[z1,z1,…,zn]∈Rk×n;pi为上述步骤ii计算得到的欧氏距离;iv)对得到的特征表示向量Z采用空间金字塔匹配方法进行处理,将Z分成2l×2l块,其中l=1,2,4,分别代表不同的三层对应的空间金字塔分块的个数;然后针对每层中每个字块的zi进行最大池化,即zi=max{|z1i|,|z2i|,…,|zji|},得到最终的低秩编码的第i向量zi,其中zji是第j块中的第i个元素,j=2l×2l,通过这个过程得到最后的特征表示矩阵Z';v)将特征表示矩阵Z'输入SVM分类器;每个图像对应有一个标签,根据每类图像类别标签和其对应的特征表示矩阵Z',学习得到SVM分类器的核函数;所述测试部分包括以下步骤过程;I)对图像库中选取训练图像后剩余的图像,提取SIFT特征,得到输入特征向量矩阵X*=[x1*,x1*,…,xn*]∈Rm×n,其中xi*∈Rn是特征向量矩阵的第i个分量向量;II)计算每个特征向量xi*和字典向量之间的欧式距离pi,计算公式如下:pi*=exp(dist(xi*,D)σ)]]>dist(xi*,D)=[dist(xi*,d1),…,dist(xi*,dk)]T,dist(xi*,di)是特征向量xi*与每一个字典向量di间的欧式距离;σ是调整局部约束速度的权重;III)计算局部约束低秩编码的特征表示向量Z*,计算公式为:Z*=(λ1I+DDT+λ1λ2Σi=1kpi*Tpi*)-1DTX*]]>其中λ1,λ2>0是权重,其中I为单位向量;pi*为上述步骤II计算得到的欧氏距离;IV)采用空间金字塔匹配方法,将特征表示向量Z*分成2l×2l块,其中l=1,2,4,分别代表不同的三层对应的空间金字塔分块的个数;然后针对每层中每个字块的zi*进行最大池化,保持特征表示向量具有一定的鲁棒性,即zi*=max{|z1i*|,|z2i*|,…,|zji*|},得到最终的低秩编码的第i向量zi*,其中zji*是第j块中的第i个元素,j=2l×2l,这样得到最后的特征表示矩阵Z*';V)将特征表示矩阵Z*'输入训练部分得到的SVM分类器,得到待分类图像所属的类别标签;VI)统计测试分类图像正确分类的百分比,得到每类测试图像最终的分类精度;所述训练部分中步骤iii以及测试部分中步骤III,计算局部约束低秩编码的特征表示向量,计算局部约束的低秩编码方法包括以下步骤;a)在字典误差为零的情况下,E1=D‑D0=0,F范数||·||F可以取代核范数||·||*;将现有的表达式minZ,D||Z||*+λ||D-D0||F+tr[YT(D-D0-E1)]+tr[YT(X-DZ-E2)]+μ12||D-D0-E1||F2+μ22||X-DZ-E2||F2]]>优化变成为minZ||Z||F+λ1/2||X-DZ||F2]]>b)低秩约束采取联合编码方式,在图像特征全局结构一致性的基础上,弥补特征的局部空间相似性,加入局部约束项上述步骤a中优化后的表达式变为:其...

【技术特征摘要】

【专利技术属性】
技术研发人员:范敏王芬杜思远
申请(专利权)人:重庆大学
类型:发明
国别省市:重庆;85

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1