一种基于稀疏表示字典学习的图像分类方法技术

技术编号:15551320 阅读:734 留言:0更新日期:2017-06-07 23:49
本发明专利技术公开一种基于稀疏表示字典学习的图像分类方法,其可以消除不同类字典之间的相关性从而提高其判别性能,提高字典的表示能力以及字典学习模型的鲁棒性。该方法采用基于块对角稀疏表示字典学习算法模型,

An image classification method based on sparse representation dictionary learning

The invention discloses a representation of image classification method based on sparse dictionary learning, which can eliminate the correlation between the same dictionary so as to improve the identification performance, improve the representation capability and robustness of the dictionary learning model dictionary. The block learning algorithm model based on block diagonal sparse representation is adopted,

【技术实现步骤摘要】

本专利技术属于图像处理及图像分类的
,具体地涉及一种基于稀疏表示字典学习的图像分类方法
技术介绍
在过去几年里,稀疏表示已在人脸识别,图像分类,以及人类动作识别等众多应用方面取得了巨大成功。稀疏表示的核心思想是大多数自然信号可以用一个超完备辞典中少量原子来表示。为解决在实际应用中遇到的问题,研究人员陆续提出了许多字典学习方法。其中,一个简单而直接的方法是使用训练样本自身作为字典原子,如稀疏表示分类(SRC)方法。这种自表示方法的成功是建立在子空间理论的基础上的。子空间理论假定大量样本信号可以构成一个线性子空间,并且由子空间衍生的样本可被同一子空间的其他样本来近似表示。尽管这种自表达方法在识别问题中表现出良好的特性,但是它对噪声和离群点十分敏感,在应用中能否成功常依赖于训练样本的质量。因此,学者们采用字典学习方法构建字典原子,用以代替训练样本自身。这类优化学习算法包括经典的MOD和K-SVD算法。在此基础上,Yang等提出的基于SRC的MFL人脸识别方法。传统字典学习方法(如MOD和K-SVD)通常是无监督的,在字典学习过程中没有引入数据的类别特性,而这种类别特性能够增强字典在识别问题中的判别能力。因此,学者们开始研究有监督的字典学习方法,通过结合训练数据的类别信息,即同类数据的一致性以及异类数据的差异性,训练学习得到字典,用以提高字典的分类和识别性能。例如,Zhang等提出了一种判别的K-SVD字典学习方法(D-KSVD)。为了提高稀疏表示模型的判别能力,除了训练样本的标签信息,学者们对稀疏系数矩阵的结构、不同类子字典之间不一致以及同类字典内的一致性等性质进行了探索和研究。针对稀疏系数矩阵的结构属性,Jiang等提出LC-KSVD算法。在此算法中,作者使系数矩阵逼近0-1块对角矩阵以表达样本的标签属性。Yang等将Fisher判别约束加入到字典学习模型中,提出了FDDL算法,用以降低样本系数的类内离散度并提高其类间离散度。针对不同类子字典之间不一致以及同类字典内的一致性,Ramirez等提出的DLSI方法。在此算法中,作者利用不一致约束减少子字典之间的相关性。此外,Kong等提出了DL-COPAR算法,该方法通过训练学习得到一个共性字典以及一组个性字典(即各类相应的子字典)。在这种方法中,共性字典可以用来提取样本之间的共性信息,个性字典可以用来提取各类样本的个性信息。Sun等提出DGSDL算法,在该方法中作者给予样本在共性字典和个性字典上的投影系数不同的权值参数,从而降低了样本中共性信息对分类效果的干扰。与此同时,来自同一类别的样本之间有着高度的相关性,因此同类样本的稀疏表示系数之间也存在着高度相关性。这种特性也能够提高稀疏表示的识别能力。学者们通常采用低秩约束来表达这种内部相关性。Zhang等提出了一种联合低秩和稀疏表示的图像识别算法。Li等提出了一种半监督并结合低秩和块稀疏结构的字典学习方法LR-CBDS。这些研究工作表明,低秩约束表示可以有效表达同类样本的类内一致性,同时能够降低样本中噪声对模型的影响,提高分类效果。
技术实现思路
本专利技术的技术解决问题是:克服现有技术的不足,提供一种基于稀疏表示字典学习的图像分类方法,其可以消除不同类字典之间的相关性从而提高其判别性能,提高字典的表示能力以及字典学习模型的鲁棒性。本专利技术的技术解决方案是:这种基于稀疏表示字典学习的图像分类方法,该方法采用基于块对角稀疏表示字典学习算法模型,s.t.X=diag(X11,X22,…,Xnn).(1)其中||X||1表示矩阵稀疏约束,||Xii||*表示矩阵低秩约束,表示矩阵正则项,表示训练样本,第i个子块矩阵Yi表示第i类训练样本,第j列向量yj表示第j个训练样本,YW表示基于训练样本的线性组合字典,表示字典组合系数,X表示训练样本Y在字典YW上的稀疏表示系数,Xii表示第i类训练样本在第i类子字典上的稀疏表示系数,m表示样本维度,N表示样本数量,K=K1+K2+...+KC表示字典原子个数,Ki表示第i类子字典的原子个数。本专利技术针对图像分类识别问题提出了一个全新的基于块对角稀疏表示的字典学习模型,其可以消除不同类字典之间的相关性从而提高其判别性能,提高字典的表示能力以及字典学习模型的鲁棒性。附图说明图1是在ExtendedYaleB人脸库的不同子字典原子个数的识别对比结果。图2是在AR人脸库的不同子字典原子个数的识别对比结果。图3是在KTH-TIPS静态纹理库的不同子字典原子个数的识别对比结果。图4是在DynTex++动态纹理库的不同子字典原子个数的识别对比结果。图5是在15-Scene场景数据库的不同子字典原子个数的识别对比结果。图6是在OxfordFlowers17数据库的不同子字典原子个数的识别对比结果。具体实施方式这种基于稀疏表示字典学习的图像分类方法,该方法采用基于块对角稀疏表示字典学习算法模型,s.t.X=diag(X11,X22,...,Xnn).(1)其中||X||1表示矩阵稀疏约束,||Xii||*表示矩阵低秩约束,表示矩阵正则项,表示训练样本,第i个子块矩阵Yi表示第i类训练样本,第j列向量yj表示第j个训练样本,YW表示基于训练样本的线性组合字典,表示字典组合系数,X表示训练样本Y在字典YW上的稀疏表示系数,Xii表示第i类训练样本在第i类子字典上的稀疏表示系数,m表示样本维度,N表示样本数量,K=K1+K2+...+KC表示字典原子个数,Ki表示第i类子字典的原子个数。本专利技术针对图像分类识别问题提出了一个全新的基于块对角稀疏表示的字典学习模型,其可以消除不同类字典之间的相关性从而提高其判别性能,提高字典的表示能力以及字典学习模型的鲁棒性。优选地,采用分离变量以及交替迭代ADMM算法对模型进行分解,再根据阈值法对l1范数和核范数进行求解。优选地,分离变量为:首先引入变量序列使得Zii=Xii,则原模型可转变为:s.t.Zii=Xii,i=1,...,CX=diag(X11,X22,...,XCC),再利用增广Lagrange法将上述模型变成无约束模型:其中Fii表示Lagrange乘子,γ表示惩罚系数,<A,B>=trace(ATB)。优选地,利用交替迭代求解方法直接求解,包括:(1)固定W和Xii求解Zii其中U∑VT表示的奇异值分解形式(SVD),表示阈值分割函数,(2)固定W和Zii求解Xii首先定义hi(·)函数如下:求解Xii如下:其中表示hi(·)函数关于Xii的一阶偏导,为:同时则Xii的解析形式为:(3)固定Xii和Zii求解W当固定Xii和Zii时,关于W的求解问题可转换为:令再逐列进行求解:其中表示Xt+1的第k行,表示的第k列,Ek定义如下:求解(4)更新Lagrange乘子Fii和惩罚参数γ6、其中ρ=1.1,γmax=1010关于此模型的收敛条件定义如下:以下对本专利技术进行更详细的说明。传统的基于稀疏表示字典学习的图像分类算法是对每一类样本训练一个子字典,其训练模型如下所示:s.t.||dj||2=1.其中Yi表示第i类训练样本,Di表示第i类子字典,Xi表示稀疏系数,dj表示字典D中的第j个原子。再将测试样本在每一类子字典上进行稀疏编码,最本文档来自技高网
...
一种基于稀疏表示字典学习的图像分类方法

【技术保护点】
一种基于稀疏表示字典学习的图像分类方法,其特征在于:该方法采用基于块对角稀疏表示字典学习算法模型,minW,Xτ||X||1+λΣi=1C||Xii||*+α||X||F2+||Y-YWX||F2,s.t.X=diag(X11,X22,...,Xnn).---(1)]]>其中||X||1表示矩阵稀疏约束,||Xii||*表示矩阵低秩约束,表示矩阵正则项,表示训练样本,第i个子块矩阵Yi表示第i类训练样本,第j列向量yj表示第j个训练样本,YW表示基于训练样本的线性组合字典,表示字典组合系数,X表示训练样本Y在字典YW上的稀疏表示系数,Xii表示第i类训练样本在第i类子字典上的稀疏表示系数,m表示样本维度,N表示样本数量,K=K1+K2+...KC表示字典原子个数,Ki表示第i类子字典的原子个数。

【技术特征摘要】
1.一种基于稀疏表示字典学习的图像分类方法,其特征在于:该方法采用基于块对角稀疏表示字典学习算法模型,minW,Xτ||X||1+λΣi=1C||Xii||*+α||X||F2+||Y-YWX||F2,s.t.X=diag(X11,X22,...,Xnn).---(1)]]>其中||X||1表示矩阵稀疏约束,||Xii||*表示矩阵低秩约束,表示矩阵正则项,表示训练样本,第i个子块矩阵Yi表示第i类训练样本,第j列向量yj表示第j个训练样本,YW表示基于训练样本的线性组合字典,表示字典组...

【专利技术属性】
技术研发人员:尹宝才朴星霖胡永利孙艳丰
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1