基于Fisher判别分析的矩阵变量受限玻尔兹曼机图像分类方法技术

技术编号：21185382 阅读：51 留言：0更新日期：2019-05-22 16:00

本发明专利技术公开一种基于矩阵变量Fisher判别分析的ClassMVRBM模型进行图像分类的方法，采用矩阵变量的Fisher准则即类内最小、类间最大准则，并整合到ClassMVRBM模型进行联合训练；首先定义了面向矩阵变量的Fisher准则，通过引入矩阵变量之间的距离度量，定义了矩阵变量的类内散度和类间散度；然后引入该矩阵变量Fisher判别准则到矩阵变量受限玻尔兹曼机分类模型(记为ClassMVRBM‑MVFDA)的目标函数；最后通过联合训练进行模型求解。本发明专利技术方法能够使同类图像的特征之间的距离小，而不同类图像的特征之间距离大，进而利于图像分类。

A Matrix Variable Constrained Boltzmann Machine Image Classification Method Based on Fisher Discriminant Analysis

The invention discloses a ClassMVRBM model based on Fisher discriminant analysis of matrix variables for image classification. The Fisher criterion of matrix variables, i.e. minimum in class and maximum between classes, is adopted and integrated into the ClassMVRBM model for joint training. Firstly, the Fisher criterion oriented to matrix variables is defined, and the matrix variables are defined by introducing the distance measure between matrix variables. Intra-class divergence and inter-class divergence are introduced, and then Fisher criterion of the matrix variable is introduced to the objective function of the Boltzmann machine classification model (classMVRBM MVFDA) with constrained matrix variables. Finally, the model is solved by joint training. The method of the invention can make the distance between the features of the same kind of image small, while the distance between the features of different kinds of images is large, thereby facilitating image classification.

全部详细技术资料下载

【技术实现步骤摘要】
基于Fisher判别分析的矩阵变量受限玻尔兹曼机图像分类方法
本专利技术属于模式识别
，尤其涉及一种基于Fisher判别分析的矩阵变量受限玻尔兹曼机分类模型的图像识别方法。
技术介绍
图像分类是模式识别、计算机视觉领域的热点研究问题。深度学习方法被广泛用于解决图像分类问题。受限玻尔兹曼机(RBM)模型是深度学习模型的经典基块之一，不过RBM通常是无监督的，为了使其能用于分类任务，Hugo等提出分类受限玻尔兹曼机(ClassRBM)，不过该模型是面向向量变量的，当用于图像分类任务时，通常需要对图像进行向量化处理。为了保持图像的空间结构，专利技术人在ClassRBM基础上已设计实现了面向矩阵变量的ClassMVRBM，在该模型中，输入和隐层都是矩阵变量，通过能量函数定义输入、隐层和标签层的联合概率分布，并通过最大化观测样本发生情况下类别标签的条件概率的对数似然进行模型求解，从而可实现分类任务，不过基于该模型提取的隐层特征不具有可判别性。在通常的图像分类任务中，希望提取到的图像特征具有一定的判别性，如基于Fisher判别分析准则约束使提取到的特征具有类内距离小，类间距离大的特点。不过传统的Fisher判别准则通常是基于向量变量定义的，当目标是使基于ClassMVRBM提取的隐层特征具有判别性时，需要重新定义基于矩阵变量的Fisher判别约束。
技术实现思路
本专利技术要解决的技术问题是：提供一种基于矩阵变量Fisher判别分析的ClassMVRBM模型进行图像分类的方法。该方法能够使同类图像的特征之间的距离小，而不同类图像的特征之间距离大，进而利于图像分类。该...

【技术保护点】
1.一种基于Fisher判别分析的矩阵变量受限玻尔兹曼机分类模型的图像识别方法，其特征在于，采用矩阵变量的Fisher准则即类内最小、类间最大准则，并整合到ClassMVRBM模型进行联合训练，包括以下步骤：步骤1、定义了面向矩阵变量的Fisher准则，通过引入矩阵变量之间的距离度量，定义了矩阵变量的类内散度和类间散度；步骤2、引入该矩阵变量Fisher判别准则到矩阵变量受限玻尔兹曼机分类模型(记为ClassMVRBM‑MVFDA)的目标函数；步骤3、通过联合训练进行模型求解。

【技术特征摘要】
1.一种基于Fisher判别分析的矩阵变量受限玻尔兹曼机分类模型的图像识别方法，其特征在于，采用矩阵变量的Fisher准则即类内最小、类间最大准则，并整合到ClassMVRBM模型进行联合训练，包括以下步骤：步骤1、定义了面向矩阵变量的Fisher准则，通过引入矩阵变量之间的距离度量，定义了矩阵变量的类内散度和类间散度；步骤2、引入该矩阵变量Fisher判别准则到矩阵变量受限玻尔兹曼机分类模型(记为ClassMVRBM-MVFDA)的目标函数；步骤3、通过联合训练进行模型求解。2.如权利要求1所述的基于Fisher判别分析的矩阵变量受限玻尔兹曼机分类模型的图像识别方法，其特征在于，步骤1具体为：给定N张训练图像X(n)∈iI*J是第n张训练图像；y(n)∈{1,2,...,c,...,C}是第n张图像的类别标签，图像的总类别数是C个，令Nc是类别为c的样本数量，则基于ClassMVRBM模型的隐层定义类内散度矩阵S(w)和类间散度矩阵S(b)，根据向量变量的FDA准则定义以及矩阵变量的F范数距离度量，定义如下矩阵变量的MVFDA判别准则：H(i)表示提取的第X(i)张图像的特征，H(j)表示提取的第X(j)张图像的特征，类内和类间邻接矩阵和定义如下:其中，y(i)是数据X(i)对应的标签，从而矩阵变量Fisher判别准则约束可形式化为：为了整合Fisher判别分析到ClassMVRBM-MVFDA模型，定义如下优化的目标函数：其中，L1对应ClassMVRBM的目标函数部分，而目标函数L2为面向矩阵变量的Fisher判别分析准则约束；超参数σ控制ClassMVRBM与MVFDA之间的平衡，进行公式(6)的优化问题求解时，上式的除法可简化等价为如下减法：目标函数L1的显式表达式为：其中，其中，X＝[xij]∈iI*J为输入图像数据，是一个二维矩阵，矩阵大小为I×J；H＝[hkl]∈iK*L表示输入图像数据的有判别性的隐层特征，大小为K×L；W＝[wijkl]∈iI*J*K*L表示输入层与输出特征层之间的关系，是X与H的连接权重，为四阶张量变量；B＝[bij]∈iI*J为图像数据层的偏移量，是一个矩阵变量；C＝[ckl]∈ik*l为特征层的偏移量，也是一个矩阵变量；y＝[yt]∈iT表示输入图像数据所属的类别标签，采用一位有效编码向量表示，即如果输入数据的标签为第t类，则该数据对应的标签层向量的第t个分量为1，其他分量均置零；P＝[pklt]∈iK*L*T为标签层y与特征层H的连接权重，是三阶张量变量，表示输入图像的标签与输出特征之间的关系；d＝[dt]∈iT为标签层的偏置向量，表示标签的偏移量；模型的输入和隐层之间的连接权重是四阶张量，总计...

【专利技术属性】
技术研发人员：李敬华，田鹏宇，孔德慧，王立春，尹宝才，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人