当前位置: 首页 > 专利查询>江南大学专利>正文

基于实时学习的高斯过程回归多模型融合建模方法技术

技术编号:11599176 阅读:170 留言:0更新日期:2015-06-12 16:38
本发明专利技术公开了一种基于实时学习的高斯过程回归多模型融合建模方法。用于复杂多变的多阶段性的化工过程。该方法是一种在线不断更新的多模型策略。用高斯混合模型对过程的不同阶段进行辨识,并采用一种自适应实时学习方法,不断更新所建立的高斯过程回归模型。当新的数据到来时,在每个不同的阶段,基于欧式距离和角度原则选择部分相似的数据,用于建立局部的高斯过程回归模型。最终根据计算得到的新的数据隶属于每个不同阶段的后验概率,对局部模型进行融合输出。能够对关键变量进行精确预测,从而提高产品质量,降低生产成本。

【技术实现步骤摘要】

本专利技术涉及基于实时学习的高斯过程回归多模型融合建模方法,属于复杂工业过程建模和软测量领域。
技术介绍
目前,化工过程的复杂性正在日益增加,对产品质量的要求也在不断提高,现代工业往往需要装备一些先进的监控系统。然而由于某些关键质量变量的传感器价格昂贵、可靠性差或者具有很大的测量滞后性等缺点,导致一些重要的过程变量不能实时有效地测量。为了解决这些问题,软测量技术在工业过程领域受到了越来越广泛的关注。在过去的十几年,基于数据驱动的软测量建模技术得到了广泛研究,用于提高产品的质量,降低对环境的影响。一些常用的线性回归的方法如偏最小二乘(partial least squares,PLS)、主成分分析(principal component analysis,PCA)等能够很好地处理输入变量和输出变量之间的线性关系。然而,输入和输出之间常常呈现非线性的关系,线性建模方法不再适用,非线性建模方法如人工神经网络(artificial neural networks,ANN)、支持向量机(support vector machine,SVM)、最小二乘支持向量机(least squares support vector machine,LS-SVM)可以得到良好的预测精度。虽然这些方法能够获得很好的全局泛化性能,但是工业过程常常呈现多阶段、时变的动态特性,预测效果往往不能得到保证。高斯过程回归(Gaussian process regression,GPR)能够基于相似准则建立局部模型,作为一种非参数概率模型,GPR模型不仅可以给出预测值,还可以得到预测值对模型的信任值。因此,选择GPR建立软测量模型。化工过程呈现严重的非线性、时变性和多阶段性。针对于多阶性,可以通过对各个操作模式的划分,建立不同的局部模型,描述在不同操作阶段的动态特性。虽然可以对化工过程的不同阶段进行有效地划分,但是在每个操作阶段,过程的时变性和设备特性可能会发生变化,这些会使软测量模型的预测性能恶化。为了避免预测精度的降低,需要不断更新在线预测模型。一种基于实时学习(just-in-time learning,JITL)的方法能够很好地处理过程的时变性和非线性,提高软测量模型的性能。与传统方法所建立的全局模型不同,JITL方法所建立的模型具有局部动态结构。传统的全局模型是离线建立的,而基于JITL方法的局部模型是在线建立的,该模型能够更好地跟踪过程当前的状态。同时,由于JITL建立的是局部模型,因此它能更好地处理过程的非线性。
技术实现思路
针对于化工过程呈现的非线性、时变性和多阶段行性,产品质量往往得不到保证,为了提高产品的质量,本专利技术提供一种可实时测量多阶段化工过程产品质量的多模型融合软测量建模方法。通过GMM对化工过程不同的阶段性进行辨识,然后在特定的阶段用JITL选择部分相似数据建立局部PCA-GPR模型。最后,对于不同的操作阶段,根据辨识得到的后验概率对不同局部模型的输出进行融合,实现对化工过程产品质量的在线估计,从而提高产量,降低生产成本。本专利技术的目的是通过以下技术方案实现的:基于实习学习的高斯过程回归多模型融合建模方法,所述方法包括以下过程:针对于复杂多变的多阶段性的化工过程,用高斯混合模型对过程的不同阶段进行辨识,并采用一种自适应实时学习方法,不断更新所建立的高斯过程回归模型。当新的数据到来时,在每个不同的阶段,基于欧式距离和角度原则选择部分相似的数据,用于建立局部的高斯过程回归模型。最终根据计算得到的新的数据隶属于每个不同阶段的后验概率,对局部模型进行融合输出,能够对关键变量进行精确预测,从而提高产品质量,降低生产成本。附图说明图1是基于GMM和JITL-GPR的在线软测量多模型融合建模流程图;图2不同比例CPU耗时;图3不同比例预测的RMSE;图4测试数据隶属于每个不同操作阶段的隶属度值;图5是数据比例为70%时在线预测结果图;具体实施方式下面结合图1所示,对本专利技术做进一步详述:以常见的化工过程——TE过程为例。实验数据来自于TE过程,对预测产品流中成分A的含量进行预测。步骤1:收集输入输出数据组成历史训练数据库。步骤2:利用这些训练数据估计得到高斯混合模型(Gaussian mixture model,GMM)的参数。然后把完整的输入和输出训练数据分配到不同的操作阶段。所述的GMM算法为:GMM是由多个高斯成分混合而成,关于数据X∈Rn×m的概率密度函数可以表示为:p(X|ΘGM)=Σk=1KπkN(X|μk,σk2)---(1)]]>其中,m是过程变量的数目,n是样本数据的大小。是高斯混合模型的参数,其中μk、和πk分别代表第k个高斯成分的均值、协方差和权值。同时,参数πk满足和0≤πk≤1。式(1)中表示多元高斯概率密度函数:N(xi|μk,σk2)=exp{-12(xi-μk)T(σk2)-1(xi-μk)本文档来自技高网
...
基于实时学习的高斯过程回归多模型融合建模方法

【技术保护点】
基于实时学习的高斯过程回归多模型融合建模方法,其特征在于,该方法步骤为:步骤1:收集输入输出数据组成历史训练数据库步骤2:利用这些训练数据估计得到高斯混合模型(Gaussian mixture model,GMM)的参数。然后把完整的输入和输出训练数据分配到不同的操作阶段。所述的GMM算法为:GMM是由多个高斯成分混合而成,关于数据X∈Rn×m的概率密度函数可以表示为:p(X|ΘGM)=Σk=1KπkN(X|μk,σk2)---(1)]]>其中,m是过程变量的数目,n是样本数据的大小。是高斯混合模型的参数,其中μk、和πk分别代表第k个高斯成分的均值、协方差和权值。同时,参数πk满足和0≤πk≤1。式(1)中表示多元高斯概率密度函数:N(xi|μk,σk2)=exp{-12(xi-μk)T(σk2)-1(xi-μk)}(2π)d/2|σk2|1/2---(2)]]>通过期望最大化算法(expectation‑maximization,EM)估计模型的参数,求解过程分为不断迭代的两步:E‑步:根据已有观测数据和由第k个成分产生的概现有模型估计缺失数据γk(xi),得到Q函数:Q(ΘGM)=Σi=1nΣk=1Kγk(xi)[lnπk-lnσk-(xi-μk)T(xi-μk)2σk2]---(3)]]>M‑步:求解Q函数对每个参数的偏导数,可以获得新的参数估计值:μk=1NkΣi=1nγk(xi)xiσk2=1NkΣi=1nγk(xi)(xi-μk)(xi-μk)Tπk=NknNk=Σi=1nγk(xi)---(4)]]>根据估计得到的GMM的参数,对于新的输入x*,其关于每个高斯成分的后验概率可以通过式(5)求得:γk(x*)=πkN(x*|μk,σk2)Σk=1KπkN(x*|μk,σk2)---(5)]]>步骤3:根据步骤2辨识得到的不同操作阶段,对应建立不同的子数据库。当一个新数据到来,根据这个新的数据隶属于每个子数据库的后验概率,对应的后验概率最大的子数据库发生更新。步骤4:针对不同的操作阶段,为了对过程变量进行降维,解决不同变量之间很强的相关性,利用传统的PCA方法对过程变量进行分析得到PCA模型的得分变量。PCA算法为:给定训练数据X∈Rn×m,m是过程变量的维数,n是训练数据的数目。PCA是在X的协方差矩阵基础上实现的。一般情况下,可以通过奇异值分解(singular value decomposition,SVD)的方法建模PCA模型。假设PCA模型有q个主成分,X可以被分解为如下形式[11]:X=TPT+T~P~T=TPT+E---(6)]]>式中,T∈Rn×q和分别是主成分子空间和残差子空间的得分矩阵,P∈Rm×q和是主成分子空间和残差子空间相应的载荷矩阵,E是残差矩阵。步骤5:当需要对输入进行预测输出时,不需要知道这个新的数据具体隶属于哪个操作阶段,用JITL在每个操作阶段选择最相似的数据建立各个操作阶段的局部PCA‑GPR模型。JITL算法如下:Step1:计算xq和xi之间的欧氏距离和角度:d(xq,xi)=||xq,xi||2,i=1,...,N---(7)]]>cos(θi)=ΔxqΔTxiT||Δxq||2·||Δxi||2,i=1,...,N---(8)]]>Δxq=xq‑xq‑1,Δxi=xi‑xi‑1如果cos(θi)≥0,计算相似系数si:si=γe-di2+(1-γ)cos(θi)---(9)]]>式中γ是介于0和1之间的权重系数,如果cos(θi)<0,丢弃数据(xi,yi)。计算得到的si也在0和1之间,si越接近1,xi与xq的相似度越高。Step2:对计算所得的所有相似系数si进行降序排列,建立局部模型时,只选择前L个相似系数较大的数据。为了选择合适比例的建模数据,针对于TE化工过程,数据比例选择从10%逐渐增大到100%,最后得到最佳的数据比例为70%。根据JITL选择的数据建立的局部GPR模型为:给定训练样本集X∈RD×N和y∈RN,其中X={xi∈RD}i=1…N,y={yi∈R}i=1…N分别代表D维的输入和输出数据。输入和输出之间的关系由公式(10)产生:y=f(x)+ε     ...

【技术特征摘要】
1.基于实时学习的高斯过程回归多模型融合建模方法,其特征在于,该方法步骤为:
步骤1:收集输入输出数据组成历史训练数据库
步骤2:利用这些训练数据估计得到高斯混合模型(Gaussian mixture model,GMM)的参数。然后把完整
的输入和输出训练数据分配到不同的操作阶段。所述的GMM算法为:
GMM是由多个高斯成分混合而成,关于数据X∈Rn×m的概率密度函数可以表示为:
p(X|ΘGM...

【专利技术属性】
技术研发人员:熊伟丽张伟薛明晨姚乐
申请(专利权)人:江南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1