基于主辅PCA模型的多变量工业过程故障检测方法技术

技术编号:20483036 阅读:24 留言:0更新日期:2019-03-02 18:15
本发明专利技术涉及一种基于主辅PCA模型的多变量工业过程故障检测方法,其步骤为:对正常数据集与先验故障数据集进行标准化处理;对正常数据集建立PCA模型作为主监控模型,计算先验故障和正常数据的相对互信息,借助广义Dice对变量进行分组,对分组后的数据集建立PCA模型作为辅助监控模型,对测试数据集进行标准化处理,将测试数据集分别向主监控模型和辅助监控模型投影,并计算其投影到主监控模型和辅助监控模型的统计量,应用贝叶斯理论整合变量组的信息得到总的监控统计量,根据监控统计量是否超出控制限判断测试数据集是否发生故障。本发明专利技术不仅有效地降低部分重要先验故障信息的遗漏和浪费,还通过变量分组挖掘变量局部信息提高故障检测率,改善故障检测性能。

【技术实现步骤摘要】
基于主辅PCA模型的多变量工业过程故障检测方法
本专利技术属于工业过程故障检测
,涉及一种基于主辅PCA模型(英文:PrimaryAssistedPrincipalComponentAnalysis,简称:PA-PCA)的多变量工业过程故障检测方法。
技术介绍
由于现代工业系统日益复杂化,人们对过程安全和产品质量日益重视,故障诊断在工业生产中的地位越来越重要。随着存储技术的发展,大量生产过程数据被采集并记录。因此,基于数据驱动的故障诊断方法得到了广泛应用。经典的故障检测方法包括主元分析(PCA)、独立元分析(ICA)和费舍尔判别分析(FDA)等方法。其中PCA方法近年来成为控制领域研究的热点,并得到了研究者们的广泛应用,但该方法仍然存在一些问题值得进一步研究。传统的PCA方法在进行统计建模时仅仅利用正常数据,忽略了部分已知先验故障信息,造成部分重要信息的遗漏和浪费,从而导致故障检测性能降低。因此,如何有效利用已知先验故障数据挖掘有效信息提高PCA的故障检测性能,已经成为一种具有挑战性的课题。
技术实现思路
本专利技术针对传统PCA方法存在的无法深入挖掘与故障相关的局部信息导致故障检测性能低等问题,提供一种基于主辅PCA模型的多变量工业过程故障检测方法。该方法能够利用先验故障信息并能够深入挖掘变量局部信息,提高故障检测率,进而改善故障检测结果。为了达到上述目的,本专利技术提供了一种基于主辅PCA模型的多变量工业过程故障检测方法,含有以下步骤:(一)收集历史数据库中的正常数据集X和C类已知故障数据集Fc,c=1,2,...,C作为训练数据集,并使用正常数据集X的均值μ和标准差σ对训练数据集X和Fc进行标准化处理,得到标准化后的训练数据集和(二)对正常数据集建立PCA模型作为主监控模型;(三)计算故障数据集相对于正常数据集的相对互信息矩阵ΔRc,c=1,2,...,C;(四)对相对互信息矩阵ΔRc,基于广义Dice系数对过程变量进行变量分组,获得分组后的数据集其中,Bc为变量组的个数;(五)对分组后的数据集建立PCA模型作为辅助监控模型;(六)采集测试数据集xnew,利用正常数据集X的均值μ和标准差σ对测试数据集xnew进行标准化处理,得到标准化后的测试数据集(七)将测试数据集分别向主监控模型和辅助监控模型投影,并计算测试数据集投影到主监控模型的统计量T2和SPE,测试数据集投影到辅助监控模型的统计量和SPEc,b,统计量T2的控制限统计量SPE的控制限SPElim、统计量的控制限和统计量SPEc,b的控制限[SPEc,b]lim均通过核密度估计计算;(八)整合所有监控结果得到总的监控统计量和BICSPE,根据统计量或统计量BICSPE是否超出控制限判断测试数据集xnew是否发生故障。进一步的,所述步骤(一)中,利用正常数据集的均值μ和标准差σ通过公式(1)对训练数据集X和Fc进行标准化处理,公式(1)的表达式为:训练数据集X和Fc经上述公式(1)标准化处理后即可获得标准化后的训练数据集和进一步的,所述步骤(二)中,对训练数据集进行PCA分解,通过公式(2)中的主监控模型计算训练数据集的负载矩阵P,公式(2)表示为:式中,T为正常数据集的得分矩阵,E为正常数据集的模型残差矩阵。进一步的,步骤(三)中,相对互信息矩阵ΔRc的计算步骤为:通过公式(3)计算正常数据集的互信息矩阵R,通过公式(4)计算已知故障数据集的互信息矩阵Rc,公式(3)和公式(4)表示为:式中,m表示变量个数,Rij表示正常数据集的第i列和第j列的互信息,Rc,ij表示已知故障数据集的第i列和第j列的互信息;相对互信息矩阵ΔRc则表示为:进一步的,步骤(四)中,进行变量分组的具体步骤为:(1)定义相对互信息向量为:ri=[ΔRc,i1,ΔRc,i2,…,ΔRc,im]T(6)用广义Dice系数衡量某一变量与其余变量之间相对互信息相关度的相似性,定义为:式中,0≤Si,j≤1;选择使||ri||最大的变量作为第一个变量组并初始化变量组的个数Bc=1;(2)按照变量顺序选择下一个向量rj(j≠i且j≤m),并通过公式(8)计算向量rj与已知变量组中各向量相似性的均值,公式(8)表示为::式中,b表示第b个变量组,nb表示第b个变量组内变量的个数;(3)确定中最大的值并判断其值是否超过阈值γ,若超过γ,则该向量所对应的变量xj被划分到变量组b中;反之,变量xj构成一个新变量组,即Bc=Bc+1;(4)重复步骤(2)和步骤(3)直至所有的变量分组完成,即进一步的,步骤(五)中,对变量分组后的数据集进行PCA分解,通过公式(9)中的辅助监控模型计算变量分组后数据集的负载矩阵Pc,b,公式(9)表示为:式中,Tc,b为数据集的得分矩阵,Ec,b为数据集的模型残差矩阵。进一步的,步骤(六)中,利用正常数据集X的均值μ和标准差σ通过公式(10)对测试数据集xnew进行标准化处理,进行标准化处理,公式(10)的表达式为:测试数据集xnew经上述公式(10)标准化处理后即可获得标准化后的测试数据集进一步的,步骤(七)中,通过公式(11)和公式(12)计算测试数据集投影到主监控模型的统计量T2和SPE,公式(11)和公式(12)表示为:式中,Σ表示主监控模型特征值组成的对角阵;通过公式(13)和公式(14)计算测试数据集投影到辅助监控模型的统计量和SPEc,b,公式(13)和公式(14)表示为:式中,Σc,b表示辅监控模型特征值组成的对角阵,表示根据第c类故障信息获得的中第b组变量。进一步的,步骤(八)中,采用贝叶斯推理整合所有监控结果,具体步骤为:定义样本在第b个统计量发生故障的概率为:式中,S表示统计量T2、统计量SPE、统计量和统计量SPEc,b,表示样本故障的后验概率,代表正常情况下的后验概率,通过公式(16)和公式(17)分别求解和公式(16)和公式(17)表示为:式中,Slim表示统计量T2、统计量SPE、统计量和统计量SPEc,b相应的控制限,P(F)为置信水平α,则P(N)=1-α,进而融合所有的监控结果所得总监控统计量为:进一步的,步骤(八)中,依据融合后的总监控统计量或总监控统计量BICSPE是否超过控制限判断测试数据是否是故障数据;当或BICSPE>0.01时,则认为过程出现了故障;否则,认为过程中并无故障发生。与现有技术相比,本专利技术的有益效果在于:本专利技术提供的多变量工业过程故障检测方法,计算先验故障和正常数据的相对互信息衡量由于故障的发生所引起变量间相关关系结构变化的差异性,借助广义Dice对变量进行分组,不仅能够充分利用已知先验故障信息,尽可能避免有用故障信息的浪费和遗漏,还能够通过变量分组提取变量的局部信息;在此基础上,分别对包含所有变量的正常数据集建立PCA模型作为主监控模型和在不同变量组的数据集建立PCA子模型作为辅助监控模型,并应用贝叶斯推理整合变量组的信息得到总的监控统计量,根据监控统计量是否超出控制限判断测试数据集是否发生故障,通过融合后的统计量判断是否发生故障,进而改善故障检测结果,提高故障检测率。附图说明图1为本专利技术基于主辅PCA模型的多变量工业过程故障检测方法的流程图;图2为本专利技术实施例所述CSTR控制系统的结构图本文档来自技高网...

【技术保护点】
1.一种基于主辅PCA模型的多变量工业过程故障检测方法,含有以下步骤:(一)收集历史数据库中的正常数据集X和C类已知故障数据集Fc,c=1,2,...,C作为训练数据集,并使用正常数据集X的均值μ和标准差σ对训练数据集X和Fc进行标准化处理,得到标准化后的训练数据集

【技术特征摘要】
1.一种基于主辅PCA模型的多变量工业过程故障检测方法,含有以下步骤:(一)收集历史数据库中的正常数据集X和C类已知故障数据集Fc,c=1,2,...,C作为训练数据集,并使用正常数据集X的均值μ和标准差σ对训练数据集X和Fc进行标准化处理,得到标准化后的训练数据集和(二)对正常数据集建立PCA模型作为主监控模型;(三)计算故障数据集相对于正常数据集的相对互信息矩阵ΔRc,c=1,2,...,C;(四)对相对互信息矩阵ΔRc,基于广义Dice系数对过程变量进行变量分组,获得分组后的数据集其中,Bc为变量组的个数;(五)对分组后的数据集建立PCA模型作为辅助监控模型;(六)采集测试数据集xnew,利用正常数据集X的均值μ和标准差σ对测试数据集xnew进行标准化处理,得到标准化后的测试数据集(七)将测试数据集分别向主监控模型和辅助监控模型投影,并计算测试数据集投影到主监控模型的统计量T2和SPE,测试数据集投影到辅助监控模型的统计量和SPEc,b,通过核密度估计分别计算统计量T2的控制限统计量SPE的控制限SPElim、统计量的控制限和统计量SPEc,b的控制限[SPEc,b]lim;(八)整合所有监控结果得到总的监控统计量和BICSPE,根据统计量或统计量BICSPE是否超出控制限判断测试数据集xnew是否发生故障。2.如权利要求1所述的基于主辅PCA模型的多变量工业过程故障检测方法,其特征在于,所述步骤(一)中,利用正常数据集的均值μ和标准差σ通过公式(1)对训练数据集X和Fc进行标准化处理,公式(1)的表达式为:训练数据集X和Fc经上述公式(1)标准化处理后即可获得标准化后的训练数据集和3.如权利要求2所述的基于主辅PCA模型的多变量工业过程故障检测方法,其特征在于,所述步骤(二)中,对训练数据集进行PCA分解,通过公式(2)中的主监控模型计算训练数据集的负载矩阵P,公式(2)表示为:式中,T为正常数据集的得分矩阵,E为正常数据集的模型残差矩阵。4.如权利要求3所述的基于主辅PCA模型的多变量工业过程故障检测方法,其特征在于,步骤(三)中,相对互信息矩阵ΔRc的计算步骤为:通过公式(3)计算正常数据集的互信息矩阵R,通过公式(4)计算已知故障数据集的互信息矩阵Rc,公式(3)和公式(4)表示为:式中,m表示变量个数,Rij表示正常数据集的第i列和第j列的互信息,Rc,ij表示已知故障数据集的第i列和第j列的互信息;相对互信息矩阵ΔRc则表示为:5.如权利要求4所述的基于主辅PCA模型的多变量工业过程故障检测方法,其特征在于,步骤(四)中,进行变量分组的具体步骤为:(1)定义相对互信息向量为:ri=[ΔRc,i1,ΔRc,i2,…,ΔRc,im]T(6)用广义Dice系数衡量某一变量与其余变量之间相对互信息相关度的相似性,定...

【专利技术属性】
技术研发人员:邓晓刚邓佳伟曹玉苹
申请(专利权)人:中国石油大学华东
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1