基于核空间的线性鉴别稀疏表示分类器的设计方法技术

技术编号:13537446 阅读:79 留言:0更新日期:2016-08-17 10:31
本发明专利技术涉及一种基于核空间的线性鉴别稀疏表示分类器的设计方法,步骤为:读取训练样本,将训练样本进行非线性变换,变换到高维的核空间,在高维核空间对每一类训练样本进行学习,找出该类训练样本中每个个体对于构造该类训练样本子空间所做的贡献(即权重),该类训练样本与权重矩阵的乘积构成词典,将所有类别的词典依次排列构成一个大的词典矩阵;通过词典矩阵获得该测试样本在核空间的线性鉴别稀疏编码,用每一类的词典及词典所对应的线性鉴别稀疏编码拟合测试样本,计算该拟合误差;拟合误差最小的类为测试样本的类别。本发明专利技术能够保证同一类样本的稀疏编码是集中的,不同类样本稀疏编码是分散的,有效地增加了样本鉴别性,提升了分类器性能。

【技术实现步骤摘要】
201610264895

【技术保护点】
一种基于核空间的线性鉴别稀疏表示分类器的设计方法,其特征在于:含有以下步骤:步骤一:设计分类器,其步骤为:(一)读取训练样本,训练样本一共C类,定义X=[X1,X2,…,Xc,…,XC]∈RD×N表示训练样本,D是训练样本的特征维度,N是训练样本总的数目,X1,X2,…,Xc,…,XC分别表示第1,2,…,c,…,C类样本,定义N1,N2,…,Nc,…,NC分别表示每类训练样本数目,则N=N1+N+,…+Nc+…+NC;(二)对训练样本进行二范数归一化,得到归一化的训练样本;(三)依次取出训练样本中的每一类,并对该类样本训练词典,训练词典的过程为:(1)取出第c类样本Xc,将Xc映射到核空间φ(Xc);(2)根据φ(Xc)训练基于稀疏编码算法的词典Bc,Bc表示第c类样本学习到的词典,该词典的训练需要满足约束条件,所述约束条件的目标函数为:其中,式中,代表F范数,α为稀疏编码算法中稀疏项约束的惩罚系数,Sc为第c类核空间训练样本的稀疏表示矩阵,K为学习得到的词典的大小,是一个权重矩阵,其每一列表示核空间样本对构造词典中每个词条的贡献大小,词典Bc=φ(XC)Wc;φ表示样本在核空间中的映射;其中,g(W1,...,WC,S1,...,SC)=ηω-β{ξ-2Σc=1C||1NCΣn=1NCS·nc||22}---(3)]]>ω记为类内散度误差,ω如下所示:w(S1,...,SC)=Σc=1CΣn=1NC||S·nc-1NcΣm=1NCS·mc||22---(4)]]>ξ记为类间散度误差,ξ如下所示:ξ(S1,...,SC)=Σc=1C1(C-1)Σd=1,d≠cC||1NCΣn=1NCS·nc-1NdΣm=1NdS·md||22---(5)]]>(3)对步骤(2)中约束条件的目标函数进行求解,即对公式(1)求解,其求解过程为:固定Wc,更新Sc;随机产生矩阵Wc,将其带入约束条件的目标函数,这时该目标函数转化成为一个l2范数正则化最小二乘问题,即目标函数转化为:f(Sc)=||φ(Xc)-φ(Xc)WcSc||F2+2αΣn=1Nc||S·nc||1+ηΣn=1Nc||S·nc-1NcΣm=1NcS·mc||22+2β||1NcΣn=1NcS·nc||22-β1(C-1)Σd=1,d≠cC||1NcΣn=1NcS·nc-1NdΣm=1NdS·md||22s.t||φ(Xc)W·kc||22≤1,∀k=1,2,...,K,c=1,2,..,C---(6)]]>式中,β为类内散度的惩罚系数;上述公式(6)简化为:f(SC)=trace{κ(Xc,Xc)-2κ(Xc,Xc)WcSc}+trace{ScT(WcTκ(Xc,Xc)Wc)Sc}+2αΣn=1Nc||S·nc||1+ηΣn=1Nc||Nc-1NcS·nc-1Nc(Σm=1,m≠nNcS·mc)||22+2βΣn=1Nc||1NcS·nc-1Nc(Σm=1,m≠nNcS·mc)||22-β(1(C-1))Σd=1,d≠cC||1NcS·nc+1Nc(Σm=1,m≠nNcS·mc)-1NdΣi=1NdS·id||F2---(7)]]>进一步把公式(7)分解成一系列子问题求解;针对Sc中的每一个元素进行求解,并剔除掉与求解无关的项,则公式(7)可以简化为:f(Sknc)=-2[κ(Xc,Xc)Wc]nkSknc+(Sknc)2{[WcTκ(Xc,Xc)Wc]kk+η(Nc-1Nc)2+β(1Nc)2}+2Σl...

【技术特征摘要】
1.一种基于核空间的线性鉴别稀疏表示分类器的设计方法,其特征在于:含有以下步骤:步骤一:设计分类器,其步骤为:(一)读取训练样本,训练样本一共C类,定义X=[X1,X2,…,Xc,…,XC]∈RD×N表示训练样本,D是训练样本的特征维度,N是训练样本总的数目,X1,X2,…,Xc,…,XC分别表示第1,2,…,c,…,C类样本,定义N1,N2,…,Nc,…,NC分别表示每类训练样本数目,则N=N1+N+,…+Nc+…+NC;(二)对训练样本进行二范数归一化,得到归一化的训练样本;(三)依次取出训练样本中的每一类,并对该类样本训练词典,训练词典的过程为:(1)取出第c类样本Xc,将Xc映射到核空间...

【专利技术属性】
技术研发人员:刘宝弟王立韩丽莎王延江
申请(专利权)人:中国石油大学华东
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1