基于马氏距离的动态局部敏感判别分析故障诊断方法技术

技术编号:36066839 阅读:14 留言:0更新日期:2022-12-24 10:34
本发明专利技术公开了一种基于马氏距离的动态局部敏感判别分析故障诊断方法,用以在复杂化工领域建立精确的过程故障诊断模型。本发明专利技术首先使用动态数据扩充技术对原始数据进行扩充,然后采用结合马氏距离的局部敏感判别分析方法对故障数据进行特征提取,从而准确地刻画系统的行为。本发明专利技术使用特征提取后的数据训练弱分类器,同时使用AdaBoost算法将弱分类器集成为强分类器,以提高故障诊断模型的精度。本发明专利技术通过所提方法对田纳西

【技术实现步骤摘要】
基于马氏距离的动态局部敏感判别分析故障诊断方法


[0001]本专利技术涉及化工
,尤其涉及一种基于马氏距离的动态局部敏感判别分析故障诊断方法。

技术介绍

[0002]随着科技的不断进步,现代化工业正发生着翻天覆地的变化,工厂操作的复杂度也急剧增加。与此同时,操作过程中测量的变量也更加具有复杂性、非线性及巨量性。在化工过程中,监测系统产生了大量的高维实测数据,对这些数据的有效利用来实现实时监控和故障诊断,为确保生产设备安全,降低维护成本,提高利润率提供了可靠的保证。
[0003]从大量信息中提取出重要的特征对于提升故障诊断的精度非常重要,因此本实施例需要更多地关注降维算法。目前,基于数据驱动的方法是一个热门研究方向。基于数据驱动的方法既不需要建立机理模型也不依赖于定性知识,而是根据工业过程中产生的历史数据建立相应的模型。具有简单、通用性好的特点。常见的基于数据驱动的方法有Principal Component Analysis(PCA)、Fisher Discriminant Analysis(FDA)和independent component analysis(ICA)。这些算法着眼于挖掘数据的全局信息,寻找最佳投影方向。由于这类方法均是基于数据集为全局线性结构的假设之上,当高维数据的结构为高度非线性或其属性强相关时,基于全局线性的假设将不再成立。这种情况下,基于全局线性的方法难以揭示高维数据本质的非线性结构以及数据内在分布的规律,最终无法反映出数据集的真实结构。

技术实现思路

[0004][0005]为解决现有技术存在的局限和缺陷,本专利技术提供一种基于马氏距离的动态局部敏感判别分析故障诊断方法,包括:
[0006]进行数据选取及预处理,选取TEP数据,其中训练集包括6种故障,每种训练集故障包括480个故障训练样本,测试集包括6种故障,每种测试集故障包括800个故障测试样本,对所述训练集和所述测试集的数据进行归一化处理;
[0007]进行动态数据扩充,在原始数据矩阵中加入过程变量的时间滞后数据,将前L个时刻的釆样数据的每个变量当成新的变量,构建原始数据的增广矩阵;
[0008]使用LSDA

M算法进行特征提取,构建类内图G
w
和类间图G
b
,使用马氏距离代替欧氏距离作为度量近邻点,获取所述类内图G
w
和所述类间图G
b
的权值,使用广义特征值分解获得投影向量A,使用所述投影向量A对原始数据进行特征提取;
[0009]使用AdaBoost算法进行建模,使用特征提取后的训练集训练弱分类器,使用AdaBoost算法将弱分类器集成为强分类器,形成故障诊断模型。
[0010]可选的,所述归一化处理的表达式如下:
[0011][0012]其中,η和σ分别是样本集的均值和标准差,测量空间R
n
的原始数据X=(x1,x2,...,x
m
),共m个点;
[0013]所述预处理后的数据矩阵的表达式如下:
[0014][0015]其中,预处理后的数据X∈R
m
×
n
,m表示样本数量,n表示样本的维数;
[0016]将前L个时刻的釆样数据的每个变量当成新的增广矩阵的变量,得到扩充后的数据矩阵的表达式如下:
[0017][0018]其中,是时刻t得到的n维观测变量,为t

1时刻得到的n 维观测变量,L为时滞阶次。
[0019]可选的,所述使用LSDA

M算法进行特征提取的步骤包括:
[0020]构建所述类内图G
w
和所述类间图G
b
,使用马氏距离作为度量近邻点的方法;
[0021]将k个近邻点分为类内近邻点N
w
(x
i
)与类间近邻点N
b
(x
i
),所述类内近邻点包含与x
i
同类的近邻点,所述类间近邻点包含与x
i
异类的近邻点,l(x
i
)是点x
i
的类别标签,获取所述类内图G
w
和所述类间图G
b
的权值的表达式如下:
[0022][0023][0024]使用所述广义特征值分解如下表达式:
[0025]argmax A
T
X(αL
b
+(1

α)W
w
)X
T
A
[0026]s.t.A
T
XD
w
X
T
A=1
[0027]获得所述投影向量A的表达式如下:
[0028]x
i

y
i
=A
T
x
i
[0029]A=(a1,a2,...,a
d
)
[0030]使用所述投影向量A对原始数据进行特征提取。
[0031]可选的,所述使用AdaBoost算法进行建模的步骤包括:
[0032]设定训练集其中是经过特征提取后的数据集, i∈[1,n],n是样本数量,y
i
∈[1,N]是样本标签,N是样本类别数;
[0033]分别初始化训练样本权重和权值向量,表达式如下:
[0034][0035][0036]将样本空间平均分成τ部分;
[0037]计算P(x
i
∈X
j

i
=j)的权重,表达式如下:
[0038][0039]设置弱分类器的输出,表达式如下:
[0040][0041]其中,δ∈[1,d];
[0042]计算归一化因子,表达式如下:
[0043][0044]选择弱分类器,使得所述归一化因子最小化;
[0045]分别计算误分类率和每个弱分类器的权重,表达式如下:
[0046][0047][0048]更新弱分类器的权重,表达式如下:
[0049][0050]输出d次循环后的强分类器,表达式如下:
[0051][0052]形成故障诊断模型。
[0053]本专利技术具有下述有益效果:
[0054]本专利技术提供了一种新型的基于马氏距离的动态局部敏感判别分析故障诊断技术,
该技术考虑了复杂工业过程数据的观测变量之间存在时序相关性,在监测矩阵中加入过程变量的时间滞后数据,构建原始数据的增广矩阵,从而准确地描述了系统的动态行为。
[0055]本专利技术提供了一种新型的基于马氏距离的局部敏感判别分析故障诊断技术,该技术使用基于马氏距离的局部敏感判别分析算法 (LSDA

M)对原始故障数据进行特征提取。该算法不仅保留了原始数据的局部几何结构、引入了判别信息本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于马氏距离的动态局部敏感判别分析故障诊断方法,其特征在于,包括:进行数据选取及预处理,选取TEP数据,其中训练集包括6种故障,每种训练集故障包括480个故障训练样本,测试集包括6种故障,每种测试集故障包括800个故障测试样本,对所述训练集和所述测试集的数据进行归一化处理;进行动态数据扩充,在原始数据矩阵中加入过程变量的时间滞后数据,将前L个时刻的釆样数据的每个变量当成新的变量,构建原始数据的增广矩阵;使用LSDA

M算法进行特征提取,构建类内图G
w
和类间图G
b
,使用马氏距离代替欧氏距离作为度量近邻点,获取所述类内图G
w
和所述类间图G
b
的权值,使用广义特征值分解获得投影向量A,使用所述投影向量A对原始数据进行特征提取;使用AdaBoost算法进行建模,使用特征提取后的训练集训练弱分类器,使用AdaBoost算法将弱分类器集成为强分类器,形成故障诊断模型。2.根据权利要求1所述的基于马氏距离的动态局部敏感判别分析故障诊断方法,其特征在于,所述归一化处理的表达式如下:其中,η和σ分别是样本集的均值和标准差,测量空间R
n
的原始数据X=(x1,x2,...,x
m
),共m个点;所述预处理后的数据矩阵的表达式如下:其中,预处理后的数据X∈R
m
×
n
,m表示样本数量,n表示样本的维数;将前L个时刻的釆样数据的每个变量当成新的增广矩阵的变量,得到扩充后的数据矩阵的表达式如下:其中,是时刻t得到的n维观测变量,为t

1时刻得到的n维观测变量,L为时滞阶次。3.根据权利要求2所述的基于马氏距离的动态局部敏感判别分析故障诊断方法,其特征在于,所述使用LSDA

M算法进行特征提取的步骤包括:构建所述类内图G
w
和所述类间图G
b
,使用马氏距离作为度量近邻点的方法;将k个近邻点分为类内近邻点N
w
(x

【专利技术属性】
技术研发人员:朱群雄宋棋徐圆贺彦林
申请(专利权)人:北京化工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1