当前位置: 首页 > 专利查询>东北大学专利>正文

一种基于线性判别邻域保持嵌入的故障分类方法技术

技术编号:32490500 阅读:8 留言:0更新日期:2022-03-02 09:56
本发明专利技术公开了一种基于线性判别邻域保持嵌入的故障分类方法,属于故障监测与诊断技术领域。本发明专利技术方法在基于类别信息的邻域保持嵌入模型的基础上引入线性判别分析思想,将基于类别信息的邻域保持嵌入模型与线性判别分析模型结合,考虑样本高维局部流形结构的同时充分考虑样本的全局结构,构建线性判别邻域保持嵌入模型并求解。通过本发明专利技术构建模型中的基于类别信息的邻域保持嵌入思想充分考虑样本局部高维流形结构,同时利用样本类别的先验信息计算线性判别分析思想中的样本类内散度矩阵和类间散度矩阵,充分考虑采集样本点的全局信息,从样本全局和局部信息的两个角度出发对高维样本进行降维,从而得到更优质的降维效果,提高对故障分类的准确性。提高对故障分类的准确性。提高对故障分类的准确性。

【技术实现步骤摘要】
一种基于线性判别邻域保持嵌入的故障分类方法


[0001]本专利技术属于故障监测与诊断
,提出了一种基于线性判别邻域保持嵌入的故障分类方法。

技术介绍

[0002]随着科学技术的不断发展和工业化水平的不断提高,工业生产逐渐向大规模、复杂化发展。一个工业生产系统中的各个组成部分之间的关联关系、耦合程度非常高。各个组成部分相互耦合,协同工作。在一方面,这种生产方式工作效率得到了很大提高,产生了巨大的经济效益;然而在另一方面,由于工业生产过程中各个组成部分关联性强,存在大量耦合,整个工业生产系统变得越来越复杂,对系统产生影响造成系统故障的因素也变得越来越多,系统发生故障的几率也随之增加,一旦发生较大的故障就可能导致停工停产,造成巨大的经济损失。国内国外都曾发生过因工业生产过程中机器故障导致的工业事故,造成了巨大的人员伤亡、经济损失和不良的社会影响。不同种类的故障会对系统造成不同的工业事故,如何进行故障检测、故障诊断,对不同种类故障进行有效分类对保障生产过程安全、工业生产系统稳定运行是十分必要和有意义的。
[0003]工业生产系统的故障数据中含有丰富的信息,大量的故障信息为故障分类研究带来了新的机遇。但由于工业生产系统的故障有数据量大、数据间相关性强、冗余度大、维数高等特点,传统故障分类方法很容易导致“维数灾难”现象。因此,如何从高维数据中有效地提取出隐含特征来降低数据维数成为故障检测、故障诊断、故障分类方面研究的重点。也就是说故障分类首先需要对待测数据进行特征提取,实现维数约简,然后再对提取出来的特征进行分类。
[0004]目前的特征提取主要有以下几种方法:主成分分析方法是将方差最大的方向作为主要特征,并且在各个正交方向上将数据“离相关”,也就是让它们在不同正交方向上没有相关性。主成分分析方法可以消除评价指标间的相关影响,减少选择指标的工作量,但该方法在特征值分解的过程有一些局限性,比如变换的矩阵必须是方阵;同时,在非高斯分布情况下,该方法得出的主元可能并不是最优的。线性判别分析算法是使投影后类内方差最小,类间方差最大,在处理类别可分性大的数据具有很好的优势。但该方法依赖于样本类别先验知识,不适合对非高斯分布样本进行降维,同时在样本分类信息依赖方差而不是均值的时候,降维效果不好。局部线性嵌入方法是一种非线性降维算法,它能够使降维后的数据较好地保持原有流形结构。该方法可以学习任意维的局部线性的低维流形,但该方法对最近邻样本数的选择敏感,不同的最近邻数对最后的降维结果有很大影响,且不能进行新样本的泛化。邻域保持嵌入的思想和局部线性嵌入相同,主要是在降维过程中保持流形的局部线性结构不变,从而来提取数据中的有用信息,同时能够进行新样本的泛化。但该方法也存在对最近邻样本数的选择敏感,不同的最近邻数对最后的降维结果有很大影响的缺点。

技术实现思路

[0005]针对现有技术存在的不足,本专利技术提出一种基于线性判别邻域保持嵌入的故障分类方法,在基于类别信息的邻域保持嵌入模型的基础上引入线性判别分析思想,考虑样本高维局部流形结构的同时充分考虑样本的全局结构,构建线性判别邻域保持嵌入模型并求解,从而充分认识到采集样本点的整体信息,获得更优质的降维效果,在某些故障的样本点比较分散的情况下,达到对故障更好的分类效果。
[0006]一种基于线性判别邻域保持嵌入的故障分类方法,该方法包括如下步骤:
[0007]步骤1:对田纳西

伊斯曼过程实施若干次的模拟仿真,每次仿真过程设置不同的故障类型,采集对田纳西

伊斯曼过程仿真获得的不同种类故障的数据,每种故障的数据构成一个样本子集,所有样本子集构成TE故障数据集;
[0008]步骤2:从TE故障数据集中随机选取两个样本子集,获取两类需要分类的故障样本点,并分别从选取出的两个样本子集中划分出测试数据和训练数据,其中所述测试数据构成测试样本集,所述训练数据构成训练样本集,训练样本集每个样本点的故障类别构成样本类别集合;
[0009]步骤3:初始化邻域保持嵌入算法相关参数,包括近邻点个数k、降维目标维数d;
[0010]步骤4:找出训练样本集中每个样本点除自身外的k个近邻点,并根据该k个近邻点构造每个样本点的邻域图;
[0011]步骤5:根据训练样本集中每个样本点的邻域图,对训练样本集中每个样本点与其近邻点的连接赋予权值,通过其近邻点的线性组合对每个样本点进行重构,并通过使重构误差最小化计算邻接矩阵W;
[0012]步骤6:根据训练样本集以及步骤5得到的邻接矩阵W,对待求解的降维后的样本点通过其降维后近邻点的线性组合进行重构,通过使重构误差函数最小化,构建邻域保持嵌入模型的目标函数;
[0013]步骤7:根据训练样本集中每个样本点的近邻点集合以及训练样本集中每个样本点的类别信息构建判别邻域嵌入模型的权值矩阵,同时引入线性判别分析算法的思想,将步骤6中求解邻域保持嵌入模型投影矩阵的重构误差函数和求解判别邻域嵌入模型投影矩阵的目标函数分别作为基于类别信息的邻域保持嵌入模型的目标函数的分母与分子,从而构建基于类别信息的邻域保持嵌入模型;
[0014]步骤8:根据训练样本集中样本的类别信息,计算样本类内散度矩阵S
w
和类间散度矩阵S
b
,构建线性判别分析模型的目标函数;
[0015]步骤9:将基于类别信息的邻域保持嵌入模型与线性判别分析模型结合,把基于类别信息的邻域保持嵌入模型目标函数的分子与线性判别分析模型目标函数的分子相加作为线性判别邻域保持嵌入模型目标函数的分子,将基于类别信息的邻域保持嵌入模型目标函数的分母与线性判别分析模型目标函数的分母相加作为线性判别邻域保持嵌入模型目标函数的分母,从而构建线性判别邻域保持嵌入模型的目标函数,并计算出线性判别邻域保持嵌入模型的投影矩阵A4;
[0016]步骤10、使用步骤9得到的投影矩阵A4对测试样本集降维,通过支持向量机方法对测试样本集中的样本进行分类。
[0017]进一步地,根据所述的基于线性判别邻域保持嵌入的故障分类方法,所述找出训
练样本集中每个样本点除自身外的k个近邻点的方法为:计算训练样本集X=[x1,

,x
n
]中每个样本点与其他所有样本点的欧氏距离,依据欧式距离找出每个样本点除自身外的k个近邻点。
[0018]进一步地,根据所述的基于线性判别邻域保持嵌入的故障分类方法,所述邻接矩阵W满足如下要求:
[0019][0020]对于非零的权值w
ij
,通过式(2)所示的重构误差函数求得:
[0021][0022][0023]其中,邻接矩阵W为n
×
n的矩阵,W的第i行第j列的值w
ij
代表着样本点x
i
与训练样本集所有样本点x
j
的连接权值;N(x
i
)为每个样本点x
i
的近邻点集合;x
i
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于线性判别邻域保持嵌入的故障分类方法,其特征在于,该方法包括如下步骤:步骤1:对某工业生产过程实施若干次的模拟仿真,每次仿真过程设置不同的故障类型,采集仿真过程获得的不同种类故障的数据,每种故障的数据构成一个样本子集,所有样本子集构成TE故障数据集;步骤2:从TE故障数据集中随机选取两个样本子集,获取两类需要分类的故障样本点,并分别从选取出的两个样本子集中划分出测试数据和训练数据,其中所述测试数据构成测试样本集,所述训练数据构成训练样本集,训练样本集每个样本点的故障类别构成样本类别集合;步骤3:初始化邻域保持嵌入算法相关参数,包括近邻点个数k、降维目标维数d;步骤4:找出训练样本集中每个样本点除自身外的k个近邻点,并根据该k个近邻点构造每个样本点的邻域图;步骤5:根据训练样本集中每个样本点的邻域图,对训练样本集中每个样本点x
i
与其近邻点的连接赋予权值,通过其近邻点的线性组合对每个样本点进行重构,并通过使重构误差最小化计算邻接矩阵W;步骤6:根据训练样本集以及步骤5得到的邻接矩阵W,对待求解的降维后的样本点通过其降维后近邻点的线性组合进行重构,通过使重构误差函数最小化,构建邻域保持嵌入模型的目标函数;步骤7:根据训练样本集中每个样本点的近邻点集合以及训练样本集中每个样本点的类别信息构建判别邻域嵌入模型的权值矩阵,同时引入线性判别分析算法的思想,将步骤6中求解邻域保持嵌入模型投影矩阵的重构误差函数和求解判别邻域嵌入模型投影矩阵的目标函数分别作为基于类别信息的邻域保持嵌入模型的目标函数的分母与分子,从而构建基于类别信息的邻域保持嵌入模型;步骤8:根据训练样本集中样本的类别信息,计算样本类内散度矩阵S
w
和类间散度矩阵S
b
,构建线性判别分析模型的目标函数;步骤9:将基于类别信息的邻域保持嵌入模型与线性判别分析模型结合,把基于类别信息的邻域保持嵌入模型目标函数的分子与线性判别分析模型目标函数的分子相加作为线性判别邻域保持嵌入模型目标函数的分子,将基于类别信息的邻域保持嵌入模型目标函数的分母与线性判别分析模型目标函数的分母相加作为线性判别邻域保持嵌入模型目标函数的分母,从而构建线性判别邻域保持嵌入模型的目标函数,并计算出线性判别邻域保持嵌入模型的投影矩阵A4;步骤10、使用步骤9得到的投影矩阵A4对测试样本集降维,通过支持向量机方法对测试样本集中的样本进行分类。2.根据权利要求1所述的基于线性判别邻域保持嵌入的故障分类方法,其特征在于,所述找出训练样本集中每个样本点除自身外的k个近邻点的方法为:计算训练样本集X=[x1,...,x
n
]中每个样本点与其他所有样本点的欧氏距离,依据欧式距离找出每个样本点除自身外的k个近邻点。3.根据权利要求1所述的基于线性判别邻域保持嵌入的故障分类方法,其特征在于,所述邻接矩阵W满足如下要求:
对于非零的权值w
ij
,通过式(2)所示的重构误差函数求得:,通过式(2)所示的重构误差函数求得:其中,邻接矩阵W为n
×
n的矩阵,W的第i行第j列的值w
ij
代表着样本点x
i
与训练样本集X中所有样本点x
j
的连接权值;N(x
i
)为训练样本集X中每个样本点x
i
的近邻点集合;x
i
(i=1,2,...,n)表示训练样本集X中的第i个样本点,x
j
(j=1,2,
……
,n)表示训练样本集X中的第j个样本点。4.根据权利要求1所述的基于线性判别邻域保持嵌入的故障分类方法,其特征在于,所述邻域保持嵌入模型的目标函数,具体形式如下:s.t.Y
T
Y=A
0T
XX
T
A0=1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)其中,Y=[y1,y2,
……
,y
n
]为训练样本集合X=[x1,...,x
n
]经过投影矩阵A0降维后的样本点集合,且满足Y=A
0T
X,A0为邻域保持嵌入模型所求的m
×
d的投影矩阵;w
ij
为样本点x
i
与样本点x
j
对应邻接矩阵W的i行j列的权值;y
j
是样本点x
i
对应近邻点降维后的样本点;I为n
×
n的单位矩阵。5.根据权利要求1所述的基于线性判别邻域保持嵌入的故障分类方法,其特征在于,所述步骤7进一步包括如下步骤:步骤7

1:根据训练样本集中每个样...

【专利技术属性】
技术研发人员:高鸿瑞张颖伟冯琳李豪朱红博
申请(专利权)人:东北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1