基于半监督自回归动态隐变量模型的故障检测方法技术

技术编号:24119303 阅读:52 留言:0更新日期:2020-05-13 02:36
本发明专利技术公开了一种基于半监督自回归动态隐变量模型的故障检测方法,该方法首先收集正常工况下高采样的过程数据和关键质量数据,按时序排列后生成的训练样本集包含过程数据和关键质量数据同时存在的有标签样本,以及只有过程数据而缺少该时刻所对应的关键质量数据的无标签样本;同时求得用于故障检测的T

Fault detection method based on semi supervised autoregressive dynamic hidden variable model

【技术实现步骤摘要】
基于半监督自回归动态隐变量模型的故障检测方法
本专利技术设计一种控制方法,具体是涉及一种基于半监督自回归动态隐变量模型的故障检测方法。
技术介绍
随着工业复杂度和规模的提升,现代工业对于生产安全和产品质量提出了更高的要求。而由于工业生产的复杂化,基于模型的传统故障检测方法将面临成本和建模难度的挑战。不过随着集散控制系统等过程控制技术的广泛应用,海量的数据得以快速收集,为基于数据的故障检测方法提供了良好的技术基础。基于数据的故障检测方法借助多元统计分析的各种方法,使采集到的高维数据实现降维和特征提取,在制药、废水处理以及石化等行业领域得到了较好的应用。而随着模型研究和实际生产工况的结合,模型改进的热点也从传统的主成分分析(PCA)和偏最小二乘估计(PLS)等静态模型转移到动态PCA(DPCA)等动态模型上。然而,由于受到检测成本和化验难度的限制,与产品质量以及过程安全相关的关键质量数据往往具有低采样的特性,造成了过程样本和关键质量样本在时序无法做到一一对应,可视为特殊的数据缺失问题。基于这一问题,半监督概率隐变量回归(SSPLVR)模型借助半监督的思想和数据时序调整的策略能够有效解决这种采样时序差异问题,但由于数据时序在预处理阶段的调整破坏了原有的动态结构,导致模型在训练时无法对动态特性进行有效监控,而在动态建模研究方面,自回归动态隐变量(ARDLV)模型在期望最大化(EM)算法的概率框架下借助扩展的动态隐变量可以实现对多阶动态特性的监测,同时兼顾了模型的互相关性,在故障检测效果上有不错的表现,但它对数据的完整性有一定的要求,无法直接处理这类特殊的数据缺失问题。因此,需要提出一种既能充分考虑到数据动态特性,又能完整利用这类特殊缺失数据信息的故障检测技术。
技术实现思路
本专利技术的目的在于针对现有技术的不足,提供一种基于半监督自回归动态隐变量模型的故障检测方法。本专利技术基于正常工况下化工过程中采集到的完整过程数据和少量的关键质量检测数据为建模样本,模型能够利用扩展的隐变量以及卡尔曼滤波算法对数据的多阶动态特性进行提取,同时通过低维的动态隐变量实现对数据互相关性的提取,整个模型实现通过EM算法建立闭环的迭代结构,并设置极大似然函数来决定模型训练的终止。另一方面,为了解决过程数据和关键质量数据在时序结构上的缺失问题,模型引入半监督的思路,将整个数据集视为一个有标签数据和无标签数据的整体,通过监控关键质量检测数据的采样状态变化实现模型训练策略的合理切换,从而能够直接利用这种特殊的缺失数据进行模型训练,并在故障检测的精度上实现提升。一种基于半监督自回归动态隐变量模型的故障检测方法,包括如下步骤:(1)收集化工过程正常工况下高采样率的过程变量数据以及正常工况下低采样率的关键质量数据,获取建模所需要的训练样本集;(2)对步骤(1)获得的数据进行标准化,并将标准化后的数据按时序对齐;(3)基于获得的数据集,构建半监督自回归动态隐变量模型;构建模型过程中,根据同时刻关键质量数据是否被采集,对步骤(2)得到的数据集进行分类,基于分类后的数据集构建所述的模型;(4)基于得到的半监督自回归动态隐变量模型,求取该模型对应的T2、SPEx、SPEy的控制限SPEx,lim、SPEy,lim,其中SPEx,lim、SPEy,lim分别为高采样的过程变量数据、低采样的关键质量数据对应的控制限;(5)在线收集化工过程的过程变量数据和关键质量数据,进行标准化处理,得到测试样本;(6)利用得到的半监督动态隐变量模型对测试集进行检测,计算测试样本的统计量、统计量,判断测试样本统计量是否超过步骤(4)得到的控制限,输出检测结果。步骤(1)或者步骤(5)中,利用集散控制系统收集正常工况下高采样的过程变量数据,利用化验手段获取正常工况下低采样的关键质量数据。步骤(1)中,得到如下数据集:其中,K为正常过程变量数据的样本数;M为过程样本的变量数,H为正常关键质量数据的样本数;R表示实数集;其中,1,2,3,…,K或者1,2,3,…,H为按照时序得到的样本标记,比如x(K)为按照时序得到的第K个过程变量数据样本;比如y(H)为按照时序得到的第H个关键质量数据样本;X为正常过程变量数据样本组成的数据集,Y为正常关键质量数据组成的数据集。本专利技术步骤(2)中,对数据集X和Y分别进行预处理或者标准化,标准化操作为:样本集中的每个元素先减去其所属变量的样本平均值,然后再除以该变量的样本标准差,使得各个过程变量和关键质量变量所对应的数据均值为零,方差为1,并将标准化后的数据按时序对齐后保存以备调用。本专利技术步骤(3)中,为便于实现对未被采集到关键质量数据的时刻对应的过程变量数据进行模型训练,根据同时刻关键质量数据是否被采集,将步骤(2)得到的数据集进行分类,得到同时包含关键质量变量和过程变量数据的样本集,以及仅包含过程变量数据的样本集,模型训练时将根据标签自动识别当前数据的样本集归属,进而切换合适的处理方法并建模。对数据集进行分类可以采用各种方法,作为一种优选的方案,建模时,由于过程变量和关键质量变量的采样率差异,实际采集得到的各变量数据按时序对齐后将得到缺失数据集,即原始得到的数据集由于关键质量采样慢,样本数少,所以和过程变量时序对齐后得到的数据集就会显得关键质量变量有很多缺失。现有的方法都要求过程变量和质量变量的采样率是一致的,无法直接利用这种缺失数据进行处理。本专利技术中,这里将预处理后数据进行时序对齐后,将空缺位置补0,形成一个“伪完整数据集”,模型的训练算法会自动判别从而采用合适的方法提取当前的实际数据中的潜在公共信息,而这些0在好司机训练过程中其实并不会参与运算,真正参与运算的是那些真实采到的数据,也就是说这里没用到上采样或下采样的预处理方法。因此针对步骤(2)得到的数据集,首先进行空缺数据的填补(比如值为0),以得到完整数据集;针对得到的完整数据集,构建对应的标签矩阵:对于同时刻有采集到关键质量变量的数据样本,其对应的标签元素为1;对于同时刻没有采集关键质量变量的数据样本,其对应的标签元素为0;建模过程中,利用得到的标签矩阵作用于所述的完整数据集,得到同时包含关键质量变量和过程变量数据的样本集,以及仅包含过程变量数据的样本集,基于得到的两个数据集完成模型的构建。具体讲,为解决过程数据和关键质量数据无法在时序上一一对应的数据缺失问题,模型中引入了标签系数ψk,其表现形式如下所示:其中,ψk的整体取值取决于质量数据集Y的相对采样间隔比S,则ψk的集合Ψ的结构如下:ψ={ψk}k=1:K={ψns+1=1}n=0:(K/s-1)上式对标签集合Ψ和相对采样间隔比s之间的关系进行归纳。其中第一个等式表示标签集合Ψ内是由取值为1或者0的不同时刻对应的标签系数ψk组成的,而第二个等式就将时刻数k和关键质量变量的相对采样间隔比s的关系具体化,归纳了标签集合Ψ内元素取值为1的分布情况,即:利用结构完整的数据集,构本文档来自技高网
...

【技术保护点】
1.一种基于半监督自回归动态隐变量模型的故障检测方法,其特征在于,包括如下步骤:/n(1)收集化工过程正常工况下高采样率的过程变量数据以及正常工况下低采样率的关键质量数据,获取建模所需要的训练样本集;/n(2)对步骤(1)获得的数据进行标准化,并将标准化后的数据按时序对齐;/n(3)基于获得的数据集,构建半监督自回归动态隐变量模型;构建模型过程中,根据同时刻关键质量数据是否被采集,对步骤(2)得到的过程变量数据进行分类,基于分类后的数据集构建所述的模型;/n(4)基于得到的半监督自回归动态隐变量模型,求取该模型对应的T

【技术特征摘要】
1.一种基于半监督自回归动态隐变量模型的故障检测方法,其特征在于,包括如下步骤:
(1)收集化工过程正常工况下高采样率的过程变量数据以及正常工况下低采样率的关键质量数据,获取建模所需要的训练样本集;
(2)对步骤(1)获得的数据进行标准化,并将标准化后的数据按时序对齐;
(3)基于获得的数据集,构建半监督自回归动态隐变量模型;构建模型过程中,根据同时刻关键质量数据是否被采集,对步骤(2)得到的过程变量数据进行分类,基于分类后的数据集构建所述的模型;
(4)基于得到的半监督自回归动态隐变量模型,求取该模型对应的T2、SPEx、SPEy控制限SPEx,lim、SPEy,lim,其中SPEx,lim、SPEy,lim分别为高采样的过程变量数据、低采样的关键质量数据对应的控制限;
(5)在线收集化工过程的过程变量数据和关键质量数据,进行标准化处理,得到测试样本;
(6)利用得到的半监督动态隐变量模型对测试集进行检测,计算测试样本的统计量、统计量,判断测试样本统计量是否超过步骤(4)得到的控制限,输出检测结果。


2.根据权利要求1所述的基于半监督自回归动态隐变量模型的故障检测方法,其特征在于,步骤(1)或者步骤(5)中,利用集散控制系统收集正常工况下高采样的过程变量数据,利用化验手段获取正常工况下低采样的关键质量数据。


3.根据权利要求1所述的基于半监督自回归动态隐变量模型的故障检测方法,其特征在于,步骤(2)中,标准化操作为:样本集中的每个元素先减去其所属变量的样本平均值,然后再除以该变量的样本标准差,使得各个过程变量和关键质量变量所对应的数据均值为零,方差为1。


4.根据权利要求1所述的基于半监督自回归动态隐变量模型的故障检测方法,其特征在...

【专利技术属性】
技术研发人员:周乐侯北平郑洪波武晓莉张淼刘薇
申请(专利权)人:浙江科技学院
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1