基于Fisher判别分析的矩阵变量受限玻尔兹曼机图像分类方法技术

技术编号:21185382 阅读:51 留言:0更新日期:2019-05-22 16:00
本发明专利技术公开一种基于矩阵变量Fisher判别分析的ClassMVRBM模型进行图像分类的方法,采用矩阵变量的Fisher准则即类内最小、类间最大准则,并整合到ClassMVRBM模型进行联合训练;首先定义了面向矩阵变量的Fisher准则,通过引入矩阵变量之间的距离度量,定义了矩阵变量的类内散度和类间散度;然后引入该矩阵变量Fisher判别准则到矩阵变量受限玻尔兹曼机分类模型(记为ClassMVRBM‑MVFDA)的目标函数;最后通过联合训练进行模型求解。本发明专利技术方法能够使同类图像的特征之间的距离小,而不同类图像的特征之间距离大,进而利于图像分类。

A Matrix Variable Constrained Boltzmann Machine Image Classification Method Based on Fisher Discriminant Analysis

The invention discloses a ClassMVRBM model based on Fisher discriminant analysis of matrix variables for image classification. The Fisher criterion of matrix variables, i.e. minimum in class and maximum between classes, is adopted and integrated into the ClassMVRBM model for joint training. Firstly, the Fisher criterion oriented to matrix variables is defined, and the matrix variables are defined by introducing the distance measure between matrix variables. Intra-class divergence and inter-class divergence are introduced, and then Fisher criterion of the matrix variable is introduced to the objective function of the Boltzmann machine classification model (classMVRBM MVFDA) with constrained matrix variables. Finally, the model is solved by joint training. The method of the invention can make the distance between the features of the same kind of image small, while the distance between the features of different kinds of images is large, thereby facilitating image classification.

【技术实现步骤摘要】
基于Fisher判别分析的矩阵变量受限玻尔兹曼机图像分类方法
本专利技术属于模式识别
,尤其涉及一种基于Fisher判别分析的矩阵变量受限玻尔兹曼机分类模型的图像识别方法。
技术介绍
图像分类是模式识别、计算机视觉领域的热点研究问题。深度学习方法被广泛用于解决图像分类问题。受限玻尔兹曼机(RBM)模型是深度学习模型的经典基块之一,不过RBM通常是无监督的,为了使其能用于分类任务,Hugo等提出分类受限玻尔兹曼机(ClassRBM),不过该模型是面向向量变量的,当用于图像分类任务时,通常需要对图像进行向量化处理。为了保持图像的空间结构,专利技术人在ClassRBM基础上已设计实现了面向矩阵变量的ClassMVRBM,在该模型中,输入和隐层都是矩阵变量,通过能量函数定义输入、隐层和标签层的联合概率分布,并通过最大化观测样本发生情况下类别标签的条件概率的对数似然进行模型求解,从而可实现分类任务,不过基于该模型提取的隐层特征不具有可判别性。在通常的图像分类任务中,希望提取到的图像特征具有一定的判别性,如基于Fisher判别分析准则约束使提取到的特征具有类内距离小,类间距离大的特点。不过传统的Fisher判别准则通常是基于向量变量定义的,当目标是使基于ClassMVRBM提取的隐层特征具有判别性时,需要重新定义基于矩阵变量的Fisher判别约束。
技术实现思路
本专利技术要解决的技术问题是:提供一种基于矩阵变量Fisher判别分析的ClassMVRBM模型进行图像分类的方法。该方法能够使同类图像的特征之间的距离小,而不同类图像的特征之间距离大,进而利于图像分类。该方法与已专利技术的ClassMVRBM模型不同的是:专利技术了矩阵变量的Fisher准则即类内最小、类间最大准则,并整合到ClassMVRBM模型进行联合训练。首先定义了面向矩阵变量的Fisher准则,通过引入矩阵变量之间的距离度量,定义了矩阵变量的类内散度和类间散度;然后引入该矩阵变量Fisher判别准则到矩阵变量受限玻尔兹曼机分类模型(记为ClassMVRBM-MVFDA)的目标函数;最后通过联合训练进行模型求解。鉴于该模型学习到的隐层特征有判别性,所以提升了图像分类效果。附图说明图1为本专利技术基于Fisher判别分析的矩阵变量受限玻尔兹曼机分类模型的图像识别方法的训练流程图。具体实施方式如图1所示,本专利技术提供一种基于Fisher判别分析的矩阵变量受限玻尔兹曼机分类模型的图像识别方法,包括以下步骤:步骤1、对获取的图像建立ClassMVRBM-MVFDA模型给定N张训练图像这里X(n)∈iI*J是第n张训练图像;y(n)∈{1,2,...,c,...,C}是第n张图像的类别标签,这里,图像的总类别数是C个。令Nc是类别为c的样本数量,则为了使提取的矩阵变量隐层特征具有同类样本类内距离小,不同类样本类间距离大的特点,基于ClassMVRBM模型的隐层定义类内散度矩阵S(w)和类间散度矩阵S(b)。根据向量变量的FDA准则定义以及矩阵变量的F范数距离度量,定义如下矩阵变量的MVFDA判别准则:H(i)表示提取的第X(i)张图像的特征,H(j)表示提取的第X(j)张图像的特征,类内和类间邻接矩阵和定义如下:其中,y(i)是数据X(i)对应的标签。从而,矩阵变量Fisher判别准则约束可形式化为:为了整合Fisher判别分析到ClassMVRBM-MVFDA模型,定义如下优化的目标函数:这里,L1对应ClassMVRBM的目标函数部分,而目标函数L2为本专利技术提出的面向矩阵变量的Fisher判别分析准则约束;超参数σ控制ClassMVRBM与MVFDA之间的平衡。进行公式(6)的优化问题求解时,为方便运算,上式的除法可简化等价为如下减法:目标函数L1的显式表达式为:其中,这里,X=[xij]∈iI*J为输入图像数据,是一个二维矩阵,矩阵大小为I×J;H=[hkl]∈iK*L表示基于本专利技术所提模型提取的输入图像数据的有判别性的隐层特征,大小为K×L;W=[wijkl]∈iI*J*K*L表示输入层与输出特征层之间的关系,是X与H的连接权重,为四阶张量变量;B=[bij]∈iI*J为图像数据层的偏移量,是一个矩阵变量;C=[ckl]∈ik*l为特征层的偏移量,也是一个矩阵变量;y=[yt]∈iT表示输入图像数据所属的类别标签,是一个向量;用一位有效编码向量表示,即如果输入数据的标签为第t类,则该数据对应的标签层向量的第t个分量为1,其他分量均置零;P=[pklt]∈iK*L*T为标签层y与特征层H的连接权重,是三阶张量变量,表示输入图像的标签与输出特征之间的关系;d=[dt]∈iT为标签层的偏置向量,表示标签的偏移量。由于模型的输入和隐层之间的连接权重是四阶张量,总计有I×J×K×L个权重参数,这使模型训练阶段有很高的时间复杂度。为减少模型参数,降低计算复杂度,假定隐含层单元和可见层单元的连接权重具有某种特定结构,从而大大减少自由参数数量,具体地,通过指定某种特定的结构对权重张量做分解。即通过定义两个矩阵U=[uki]∈iK*I,V=[vlj]∈iL*J,使W=UV,从而把权重参数减少到K×I+L×J。至此,已显式地给出了L1和L2的表达式,接下来通过模型优化求解最优的模型参数{U,V,P,B,C,d}。步骤2、ClassMVRBM-MVFDA模型的优化待优化模型参数为{U,V,P,B,C,d},训练过程就是通过训练数据更新模型参数,寻找使模型目标函数最大化的最优参数组合。本模型中,B对应输入数据的偏置,而目标函数L1和L2分别旨在求输入所属类别的条件概率和基于输入提取的隐层特征的Fisher判别约束,此过程不涉及输入图像X的重构,所以参数B不需要更新,即目标函数对参数B的偏导数为0,从而只需更新其它五个参数{U,V,P,C,d}。本专利技术首先分别对目标函数L1和L2关于各参数求偏导,然后加权综合两项的结果求解。为了计算L2关于各参数的导数,首先计算L2对H(i)的偏导数:然后计算H(i)对各参数的偏导数,这里,需要说明的是,在ClassMVRBM中,H(i)是基于输入图像和标签共同计算的,但当求L2关于各参数的偏导数时,因为通常的Fisher准则同类样本类内距离小、不同类样本类间距离大是针对输入图像本身,而不考虑标签,所以这里我们认为L2影响最大的是三个参数,即θ2={U,V,C},所以只考虑对这三个参数求偏导,即:这里,Pt∈iK*L表示向量y中第t个分量与各个隐层节点之间的连接权重。根据链式法则,目标函数L2对θ2={U,V,C}中各个参数的求导公式为:这里,(12)(13)(14)为使用一个训练样本X(i)计算各个参数偏导的公式。⊙表示两个矩阵的对应像素的逐像素乘积。目标函数L1对各参数的梯度计算如下:p(yt|X(n))表示由训练数据X(n)计算得到的第t类的概率值,表示遍历所有可能的C个类别。计算出目标函数L1和目标函数L2对各个参数的导数之后,模型对参数的更新公式为:其中超参数σ控制ClassMVRBM模型与MVFDA判别目标函数L2之间的平衡,η为学习率。表示目标函数L1对参数U的偏导数,即其它同理;表示目标函数L2对参数U的偏导数,即其它同理。训练模型时本文档来自技高网...

【技术保护点】
1.一种基于Fisher判别分析的矩阵变量受限玻尔兹曼机分类模型的图像识别方法,其特征在于,采用矩阵变量的Fisher准则即类内最小、类间最大准则,并整合到ClassMVRBM模型进行联合训练,包括以下步骤:步骤1、定义了面向矩阵变量的Fisher准则,通过引入矩阵变量之间的距离度量,定义了矩阵变量的类内散度和类间散度;步骤2、引入该矩阵变量Fisher判别准则到矩阵变量受限玻尔兹曼机分类模型(记为ClassMVRBM‑MVFDA)的目标函数;步骤3、通过联合训练进行模型求解。

【技术特征摘要】
1.一种基于Fisher判别分析的矩阵变量受限玻尔兹曼机分类模型的图像识别方法,其特征在于,采用矩阵变量的Fisher准则即类内最小、类间最大准则,并整合到ClassMVRBM模型进行联合训练,包括以下步骤:步骤1、定义了面向矩阵变量的Fisher准则,通过引入矩阵变量之间的距离度量,定义了矩阵变量的类内散度和类间散度;步骤2、引入该矩阵变量Fisher判别准则到矩阵变量受限玻尔兹曼机分类模型(记为ClassMVRBM-MVFDA)的目标函数;步骤3、通过联合训练进行模型求解。2.如权利要求1所述的基于Fisher判别分析的矩阵变量受限玻尔兹曼机分类模型的图像识别方法,其特征在于,步骤1具体为:给定N张训练图像X(n)∈iI*J是第n张训练图像;y(n)∈{1,2,...,c,...,C}是第n张图像的类别标签,图像的总类别数是C个,令Nc是类别为c的样本数量,则基于ClassMVRBM模型的隐层定义类内散度矩阵S(w)和类间散度矩阵S(b),根据向量变量的FDA准则定义以及矩阵变量的F范数距离度量,定义如下矩阵变量的MVFDA判别准则:H(i)表示提取的第X(i)张图像的特征,H(j)表示提取的第X(j)张图像的特征,类内和类间邻接矩阵和定义如下:其中,y(i)是数据X(i)对应的标签,从而矩阵变量Fisher判别准则约束可形式化为:为了整合Fisher判别分析到ClassMVRBM-MVFDA模型,定义如下优化的目标函数:其中,L1对应ClassMVRBM的目标函数部分,而目标函数L2为面向矩阵变量的Fisher判别分析准则约束;超参数σ控制ClassMVRBM与MVFDA之间的平衡,进行公式(6)的优化问题求解时,上式的除法可简化等价为如下减法:目标函数L1的显式表达式为:其中,其中,X=[xij]∈iI*J为输入图像数据,是一个二维矩阵,矩阵大小为I×J;H=[hkl]∈iK*L表示输入图像数据的有判别性的隐层特征,大小为K×L;W=[wijkl]∈iI*J*K*L表示输入层与输出特征层之间的关系,是X与H的连接权重,为四阶张量变量;B=[bij]∈iI*J为图像数据层的偏移量,是一个矩阵变量;C=[ckl]∈ik*l为特征层的偏移量,也是一个矩阵变量;y=[yt]∈iT表示输入图像数据所属的类别标签,采用一位有效编码向量表示,即如果输入数据的标签为第t类,则该数据对应的标签层向量的第t个分量为1,其他分量均置零;P=[pklt]∈iK*L*T为标签层y与特征层H的连接权重,是三阶张量变量,表示输入图像的标签与输出特征之间的关系;d=[dt]∈iT为标签层的偏置向量,表示标签的偏移量;模型的输入和隐层之间的连接权重是四阶张量,总计...

【专利技术属性】
技术研发人员:李敬华田鹏宇孔德慧王立春尹宝才
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1