当前位置: 首页 > 专利查询>清华大学专利>正文

基于局部自适应标准化的化工系统多工况故障检测方法技术方案

技术编号:24754865 阅读:58 留言:0更新日期:2020-07-04 08:53
本发明专利技术涉及一种基于局部自适应标准化的化工系统多工况故障检测方法,属于化工过程监控、工业数据处理和过程系统工程技术领域。本方法提出了局部自适应标准化方法,并应用了深度神经网络的变分自动编码器技术,通过计算局部移动窗口内数据的平均值,作为局部自适应标准化的平均值参数,针对不同的数据使用不同的平均值,具有自适应能力。本方法利用局部自适应标准化处理,通过检测局部移动窗口内数据是否发生偏离趋势来进行故障检测。本方法能够适用于任意工况,而且具有更高的准确率和更强的泛化能力,能够满足实时检测的需求,通过早期预警故障避免化工事故发生或者减小事故带来的危害。

Multi condition fault detection method for chemical system based on local adaptive standardization

【技术实现步骤摘要】
基于局部自适应标准化的化工系统多工况故障检测方法
本专利技术涉及一种基于局部自适应标准化的化工系统多工况故障检测方法,属于化工过程监控、工业数据处理和过程系统工程

技术介绍
石化行业安全生产涉及化学品生命周期中的各个环节,由于生产环节化学品数量规模大且人员分布集中,一旦发生事故将造成严重的财产损失、人员伤亡和环境破坏。随着信息化技术的不断进步和推广实施,化学工业进入大数据时代。故障检测技术是化工过程安全领域的基础关键技术,其目的是通过收集并分析工业过程实时数据,区分化工系统是处于正常运行状态还是发生故障。随着化工厂的自动化程度不断提高,大部分化工厂都布置了先进过程控制系统和工业大数据存储平台,因此,近年来基于数据驱动的化工故障检测方法成为学术界和工业界的研究热点。数据驱动的故障检测主要包括两类方法。第一类方法是多元统计过程监控方法,包括主成分分析(PrincipalComponentAnalysis,PCA)和偏最小二乘(PartialLeastSquares,PLS)。由于化工过程具有多变量、动态性、非线性等特点,为了更高地应用于化工过程,研究人员提出了基于PCA和PLS的动态方法和核方法。第二类方法是基于深度神经网络的方法,包括深度置信网络,卷积神经网络和变分自动编码器(VariationalAnto-encoder,VAE)。其中VAE方法可以通过仅使用正常运行数据,就能训练得到用于化工故障检测的监控模型。相比于多元统计过程监控方法,深度神经网络具有更高的准确率、召回率和更强的泛化能力。近年来,随着CPU、GPU等硬件计算能力的发展,该类方法的计算速度已经能够满足工业数据监控的实时性要求,在实际应用中具有更大的优势。然而,随着原料、市场、环境等因素影响,化工装置在生产环节中需要不断调整操作条件,即存在多工况特性。现有的基于深度神经网络的化工故障检测方法的问题在于,对正常过程变量数据通常假设其服从正态分布或单峰分布,在输入模型之前需要对数据进行标准化,因此模型只能适用于单一工况。面对化工多工况的特性,现有的深度神经网络方法并不能有效地应对,将无法完成对化工过程的故障检测任务。针对化工多工况特性,目前的研究通常利用局部近邻标准化结合多元统计过程监控方法,该方法用局部近邻标准化对数据进行预处理,再利用标准化后的数据对PCA或PLS方法进行建模。原始的标准化方法是利用历史正常运行数据的平均值和标准差对变量的分布进行估计,在进行在线数据标准化时,利用固定的历史平均值和标准差进行计算,但是不同工况下的平均值和标准差差距巨大,因此只能用于单一工况。局部近邻标准化是通过寻找当前数据在历史正常运行数据中的局部近邻集,用局部近邻集的平均值和标准差进行计算。局部近邻标准化能够找到当前数据属于某个工况,再利用该工况的数据对其进行标准化处理,因此能够将多个工况的数据映射到近似单峰分布,进而可以完成对历史工况的故障检测。该类方法的问题在于,局部近邻标准化仍然使用历史数据对平均值和标准差进行计算,高度依赖历史工况,只能应用于历史上已经存在的工况。一旦化工过程运行在新工况下,历史数据中不存在近邻数据,则仍然无法完成故障检测任务。到目前为止,尚未出现能够监控化工过程所有工况的通用故障检测方法。
技术实现思路
本专利技术的目的是提出一种基于局部自适应标准化的化工系统多工况故障检测方法,以克服现有方法的不足,应用深度神经网络的变分自动编码器技术,利用局部自适应标准化对局部移动窗口的数据进行处理,再将窗口数据输入变分自动编码器模型检测是否有偏离的趋势,判断过程数据是否是正常运行状态还是发生故障,从而在早期数据发生偏离时进行预警,最大限度地减少化工事故发生的可能性。本专利技术提出的基于局部自适应标准化的化工系统多工况故障检测方法,包括以下步骤:(1)从化工系统的历史数据库中获取N种工况下的正常运行数据集Dhistory,数据集Dhistory共有m行n列数据,其中,m代表化工系统的过程变量,n代表总运行时间;(2)将步骤(1)中的正常运行数据集Dhistory划分成训练集Dtrain和验证集Dvalid,训练集Dtrain包括m行ntrain列数据,验证集Dvalid包括m行nvalid列数据,其中训练集Dtrain占历史正常运行数据集的Dhistory比例为60%≤a≤90%;(3)将步骤(2)中的训练集Dtrain和验证集Dvalid进行局部自适应标准化处理,得到转化后的训练集Ttrain和验证集Tvalid,具体步骤如下:(3-1)利用步骤(2)的训练集Dtrain中的正常运行数据,利用下式计算化工系统中m个过程变量的全局平均标准差gmstd(Dtrain),包括m个数值:其中,i代表化工过程的工况序号,1≤i≤N,则Dtrain,i代表训练集Dtrain中第i种工况的正常运行数据,std(Dtrain,i)代表训练集Dtrain中第i种工况的标准差向量,包括m个数值,通过计算对应变量的标准差得到std(Dtrain,i),ntrain,i代表训练集Dtrain中第i种工况的正常运行数据的数量,(3-2)对于步骤(2)的训练集Dtrain中的第k个正常运行数据xk,k代表训练集Dtrain中的运行时间序号,k=1、2...、ntrain,xk包括时间序号为k的m个变量数值,计算时间向前选取时间窗口为t的局部移动窗口数据wk,wk共有m行t列数据,其中t为时间窗口,10≤t≤100:利用局部移动窗口数据wk,计算wk中的m个变量的平均值,得到mean(wk),mean(wk)包括m个数值;(3-3)利用步骤(3-1)中的gmstd(Dtrain)和步骤(3-2)中的mean(wk),对步骤(3-2)的局部移动窗口数据wk进行局部自适应标准化,使wk数据的m个变量近似转化为标准正态分布,得到局部自适应标准化的局部移动窗口数据(3-4)重复步骤(3-2)和步骤(3-3),依次计算训练集中Dtrain内每个正常运行数据,得到局部自适应标准化的训练集Ttrain;(3-5)对于步骤(2)的验证集Dvalid中的第p个正常运行数据xp,p代表验证集Dvalid中的运行时间序号,p=1、2...、nvalid,xp包括时间序号为p的m个变量数值,时间向前选取时间窗口为t的局部移动窗口数据wp,wp共有m行t列数据,其中t是步骤(3-2)中的时间窗口:利用局部移动窗口数据wp,计算wp中的m个变量的平均值,得到mean(wp),mean(wp)包括m个数值;(3-6)利用步骤(3-1)中的gmstd(Dtrain)和步骤(3-5)中的mean(wp),对步骤(3-5)的局部移动窗口数据wp进行局部自适应标准化,使wp数据的m个变量近似转化为标准正态分布,得到局部自适应标准化的局部移动窗口数据(3-7)重复步骤(3-5)和步骤(3-6),依次计算验证集中Dvalid内每个正常运行数据,得到局部自适应标准化的验证集本文档来自技高网
...

【技术保护点】
1.一种基于局部自适应标准化的化工系统多工况故障检测方法,其特征在于,包括以下步骤:/n(1)从化工系统的历史数据库中获取N种工况下的正常运行数据集D

【技术特征摘要】
1.一种基于局部自适应标准化的化工系统多工况故障检测方法,其特征在于,包括以下步骤:
(1)从化工系统的历史数据库中获取N种工况下的正常运行数据集Dhistory,数据集Dhistory共有m行n列数据,其中,m代表化工系统的过程变量,n代表总运行时间;
(2)将步骤(1)中的正常运行数据集Dhistory划分成训练集Dtrain和验证集Dvalid,训练集Dtrain包括m行ntrain列数据,验证集Dvalid包括m行nvalid列数据,其中训练集Dtrain占历史正常运行数据集的Dhistory比例为60%≤a≤90%;
(3)将步骤(2)中的训练集Dtrain和验证集Dvalid进行局部自适应标准化处理,得到转化后的训练集Ttrain和验证集Tvalid,具体步骤如下:
(3-1)利用步骤(2)的训练集Dtrain中的正常运行数据,利用下式计算化工系统中m个过程变量的全局平均标准差gmstd(Dtrain),包括m个数值:



其中,i代表化工过程的工况序号,1≤i≤N,则Dtrain,i代表训练集Dtrain中第i种工况的正常运行数据,std(Dtrain,i)代表训练集Dtrain中第i种工况的标准差向量,包括m个数值,通过计算对应变量的标准差得到std(Dtrain,i),ntrain,i代表训练集Dtrain中第i种工况的正常运行数据的数量,
(3-2)对于步骤(2)的训练集Dtrain中的第k个正常运行数据xk,k代表训练集Dtrain中的运行时间序号,k=1、2...、ntrain,xk包括时间序号为k的m个变量数值,计算时间向前选取时间窗口为t的局部移动窗口数据wk,wk共有m行t列数据,其中t为时间窗口,10≤t≤100:



利用局部移动窗口数据wk,计算wk中的m个变量的平均值,得到mean(wk),mean(wk)包括m个数值;
(3-3)利用步骤(3-1)中的gmstd(Dtrain)和步骤(3-2)中的mean(wk),对步骤(3-2)的局部移动窗口数据wk进行局部自适应标准化,使wk数据的m个变量近似转化为标准正态分布,得到局部自适应标准化的局部移动窗口数据



(3-4)重复步骤(3-2)和步骤(3-3),依次计算训练集中Dtrain内每个正常运行数据,得到局部自适应标准化的训练集Ttrain;
(3-5)对于步骤(2)的验证集Dvalid中的第p个正常运行数据xp,p代表验证集Dvalid中的运行时间序号,p=1、2...、nvalid,xp包括时间序号为p的m个变量数值,时间向前选取时间窗口为t的局部移动窗口数据wp,wp共有m行t列数据,其中t是步骤(3-2)中的时间窗口:



利用局部移动窗口数据wp,计算wp中的m个变量的平均值,得到mean(wp),mean(wp)包括m个数值;
(3-6)利用步骤(3-1)中的gmstd(Dtrain)和步骤(3-5)中的mean(wp),对步骤(3-5)的局部移动窗口数据wp进行局部自适应标准化,使wp数据的m个变量近似转化为标准正态分布,得到局部自适应标准化的局部移动窗口数据



(3-7)重复步骤(3-5)和步骤(3-6),依次计算验证集中Dvalid内每个正常运行数据,得到局部自适应标准化的验证集Tvalid;
(4)构建一个变分自动编码器,包括编码器和解码器两部分,并利用步骤(3-4)得到的训练集Ttrain对该变分自动编码器进行训练,得到训练完毕的变分自动编码器,具体步骤如下:
(4-1)利用卷积神经网络、循环神经网络或深度置信网络,设计并构建编码器,将步骤(3-3)的局部自适应标准化的局部移动窗口数据作为编码器的输入,映射得到的特征向量σk和μk,特征向量σk和μk分别有l个数值,l表示特征向量的维度,m≤l≤4m:






(4-2)利用步骤(4-1)的特征向量σk和μk,进行重参数化得到的隐藏特征向量hk,hk包括l个数值:
hk=μk+σk⊙∈
其中∈是从标准正态分布随机采样得到,⊙表示向量对应元素相乘;
(4-3)利用卷积神经网络、循环神经网络或深度置信网络,设计并构建解码器,将步骤(4-2)的隐藏特征向量hk作为解码器的输入,重构得到与步骤(3-3)的具有相同维度的重构数据共有m行t列数据:



(4-4)根据如下损失函数,利用步骤(4-1)的特征向量σk和μk以及步骤(4-3)的重构数据计算步骤(3-3)局部自适应标准化的局部移动窗口数据的误差




即为变分自动编码器的损失函数,损失函数包括重构损失和KL散度损失λ是KL散度损...

【专利技术属性】
技术研发人员:赵劲松吴昊
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1