当前位置: 首页 > 专利查询>江南大学专利>正文

基于EGMM的高斯过程回归软测量建模方法技术

技术编号:11729945 阅读:120 留言:0更新日期:2015-07-15 02:34
本发明专利技术公开了一种基于EGMM的高斯过程回归软测量建模方法。用于复杂多变、噪声非高斯性的化工过程。工业过程建立的软测量预测模型往往会产生预测误差,然而模型预测误差常常包含了丰富的有用信息,因此可以从这些预测误差中提取信息用于对模型的输出进行补偿,从而改进所建立的软测量模型。首先,选择合适的变量组成误差数据,优化得到合适的高斯成分的个数;然后用EGMM对误差数据进行拟合;当新的数据到来时,用建立的GPR模型进行预测输出,并通过EGMM模型求得条件误差均值,对输出进行补偿得到更加精确的结果。能够对关键变量进行更加精确的预测,从而提高产品质量,降低生产成本。

【技术实现步骤摘要】

本专利技术涉及基于EGMM的高斯过程回归软测量建模方法,属于复杂工业过程建模和软测量领域。
技术介绍
现代工业过程中,基于数据驱动的软测量建模方法得到了越来越多的关注。一些常用的软测量建模方法如偏最小二乘(partial least squares,PLS)、主成分分析(principal component analysis,PCA)等能够很好地处理输入变量和输出变量之间的线性关系。人工神经网络(artificial neural networks,ANN)、支持向量机machine,SVM)、最小二乘支持向量机(least(support vector squares support vector machine,LS-SVM)能够有效地处理过程的非线性关系。近年来,高斯过程回归(Gaussian process regression,GPR)作为一种非参数概率模型,不仅可以给出预测值,还可以得到预测值对模型的信任值。本专利技术选择GPR模型作为基本的软测量模型。这些建模方法虽可以有效地处理过程高度的非线性和输入输出之间高维的映射关系,但是这些数据模型往往都是假设建模误差符合高斯分布所建立的。事实上,工业过程中常常包含了不同的随机分布、多样的测量散射和非测量输入(隐藏输入),建模往往非常复杂。因此,一般认为误差分布符合高斯分布是一种比较严苛的假设,所建立的往往是局部优化的预测模型。为了提高建模精度,用一种基于高斯混合模型(Gaussian mixture model,GMM)的建模策略提取隐含在预测误差中的信息。只要GMM模型包含足够多的高斯成分,就能够逼近任意连续的概率密度函数。因此,可以用GMM描述复杂的非高斯的模型误差特征,通过加入训练数据的输出误差构建误差数据集,建立误差高斯混合模型(error Gaussian mixture model,EGMM),通过对从EGMM提取出来的信息进行检验假设或者数据模型改进,从而能提高建模的精度。因此,需要用合适的相关变量构建一个概率EGMM模型,从而使隐含在预测误差中的复杂的概率特征能够被提取出来,以达到提高模型精度的目的。通过EGMM模型,对于一个新的输入,可以计算得到误差的概率密度函数、误差均值和误差方差。误差方差可用来评估模型预测输出值的可靠性,用来决定当前模型是否需要更新,从而根据当前过程的动态产生一个自适应的软测量模型。误差均值可以用来对这个新的输入的预测输出值进行补偿,提高模型预测输出的精度。
技术实现思路
本化工过程呈现的非线性、不同的动态特性和噪声的非高斯性对所建立的软测量模型的预测精度会产生很大的影响,为了提高产品的质量,本专利技术提供一种基于EGMM的高斯过程回归软测量建模方法。首先,选择合适的变量组成误差数据,优化得到合适的高斯成分的个数;然后用EGMM对误差数据进行拟合;当新的数据到来时,用建立的GPR模型进行预测输出,并通过EGMM模型求得条件误差均值,对输出进行补偿得到更加精确的结果。从而提高产量,降低生产成本。本专利技术是通过以下技术方案实现的:基于EGMM的高斯过程回归软测量建模方法,所述方法包括以下过程:首先,基于PCA选择合适的变量组成误差数据;然后,采用BIC准则优化得到合适的高斯成分的个数;最后,构建误差高斯混合模型;当新的数据到来时,用建立的GPR模型进行预测输出,并通过EGMM模型求得条件误差均值,对输出进行补偿得到更加精确的结果。从而提高产量,降低生产成本。附图说明图1是基于EGMM的高斯过程回归软测量建模方法流程图;图2硫回收装置示意图;图3PCA模型主成分显示解释比例;图4BIC值与K之间的关系;图5是H2S的浓度预测结果图。具体实施方式下面结合图1所示,对本专利技术做进一步详述:以实际化工过程为例,硫回收装置(Sulfur Recovery Unit,SRU)用于含硫气体(主要含有H2S,SO2)排入大气前硫的回收,以防止对环境造成污染,其装置见图2。SRU装置主要处理两种酸性气体:一种是富含H2S的气体(也称MEA气体);另一种是来自于含硫污水汽提设备(SWS)的含H2S、NH3的气体,也称为SWS气体。主要燃烧室用于处理MEA气体,在有着充足空气(AIR_MEA)的情况下,可以充分燃烧;另一个燃烧室用于处理SWS气体,其进入的空气流量可写为AIR_SWS。5个过程变量和2个主导变量的描述见表1所示。实验数据来自实际工业过程,对H2S的含量进行预测。步骤1:收集输入输出数据组成历史训练数据库。步骤2:对输入和输出数据进行标准化处理,并用PCA进行信息提取得到得分矩阵。由图3所示,从PCA模型中提取出三个主成分。PCA算法为:给定训练数据X∈Rn×m,m是过程变量的维数,n是训练数据的数目。PCA是在X的协方差矩阵基础上实现的。一般情况下,可以通过奇异值分解(singular value decomposition,SVD)的方法建模PCA模型。假设PCA模型有q个主成分,X可以被分解为如下形式: X = T P T + T ~ P ~ T = TP T + E - - - ( 1 ) ]]>式中,T∈Rn×q和分别是主成分子空间和残差子空间的得分矩阵,P∈Rm×q和是主成分子空间和残差子空间相应的载荷矩阵,E是残差矩阵。建立得分矩阵和输出数据之间的GPR模型,然后用已经建立的GPR模型对训练数据集的得分矩阵进行预测得到预测值,最后得到输出误差。建立的GPR模型为:给定训练样本集X∈RD×N和y∈RN,其中X={xi∈RD本文档来自技高网
...
基于EGMM的高斯过程回归软测量建模方法

【技术保护点】
基于EGMM的高斯过程回归软测量建模方法,其特征在于,该方法步骤为:步骤1:收集输入输出数据组成历史训练数据库步骤2:对输入和输出数据进行标准化处理,并用PCA进行信息提取得到得分矩阵。PCA算法为:给定训练数据X∈Rn×m,m是过程变量的维数,n是训练数据的数目。PCA是在X的协方差矩阵基础上实现的。一般情况下,可以通过奇异值分解(singular value decomposition,SVD)的方法建模PCA模型。假设PCA模型有q个主成分,X可以被分解为如下形式:X=TPT+T~P~T=TPT+E---(1)]]>式中,T∈Rn×q和分别是主成分子空间和残差子空间的得分矩阵,P∈Rm×q和是主成分子空间和残差子空间相应的载荷矩阵,E是残差矩阵。步骤3:建立得分矩阵和输出数据之间的GPR模型,然后用已经建立的GPR模型对训练数据集的得分矩阵进行预测得到预测值,最后得到输出误差。建立的GPR模型为:给定训练样本集X∈RD×N和y∈RN,其中X={xi∈RD}i=1…N,y={yi∈R}i=1…N分别代表D维的输入和输出数据。输入和输出之间的关系由公式(10)产生:y=f(x)+ε             (2)其中f是未知的函数形式,ε是均值为0,方差为的高斯噪声。对于一个新的输入x*,相应的概率预测输出y*也满足高斯分布,其均值和方差如式(3)和(4)所示:y*(x*)=cT(x*)C‑1y              (3)σy*2(x*)=c(x*,x*)-cT(x*)C-1c(x*)---(4)]]>式中c(x*)=[c(x*,x1),…,c(x*,xn)]T是训练数据和测试数据之间的协方差矩阵。是训练数据之间的协方差矩阵,I是N×N维的单位矩阵。c(x*,x*)是测试数据的自协方差。GPR可以选择不同的协方差函数c(xi,xj)产生协方差矩阵Σ,只要选择的协方差函数能保证产生的协方差矩阵满足非负正定的关系。本文选择高斯协方差函数:c(xi,xj)=vexp[-12Σd=1Dωd(xid-xjd)2]---(5)]]>式中v控制协方差的量度,ωd代表每个成分xd的相对重要性。对式(5)中的未知参数v,ω1,…,ωD和高斯噪声方差的估计,一般最简单的方法就是通过极大似然估计得到参数θ=[v,σn2,ω1,...,ωD].]]>L(θ)=-12log(det(C))-12yTC-1y-N2log(2π)---(6)]]>为了求得参数θ的值,首先将参数θ设置为一个合理范围内的随机值,然后用共轭梯度法得到优化的参数。获得最优参数θ后,对于测试样本x*,可以用式(3)和(4)来估计GPR模型的输出值。步骤4:基于输出误差和输入得分矩阵组成的误差数据集建立EGMM模型。然后计算得到条件误差均值和方差的表达式。建立EGMM模型的步骤如下所示:建立EGMM模型,首先需要确定合适的误差数据和高斯成分的数目K。一般误差数据是由GPR模型的输入变量和模型的输出误差组成。给定训练样本集X∈RD×N和y∈RN,其中X={xi∈RD}i=1…N,y={yi∈R}i=1…N分别代表D维的输入和输出数据。在用PCA对输入变量进行降维处理之前需要对数据进行标准化处理,得到标准化数据集用于建立PCA模型,然后得到得分矩阵T={ti∈Ra}i=1…N,a<D表示所选择的主成分的数目。基于得分矩阵T和输出向量y={yi∈R}i=1…N建立GPR模型:y=[y1,y2,...,yN]=[f(t1),f(t2),...,f(tN)]~GP(0,C)---(7)]]>因此误差数据矩阵可以表示成:Xe=[T,e]              (8)式中表示GPR模型关于训练集的预测输出误差向量。由于任意一个样本数据xe∈Ra+1服从非高斯分布,一个单独的高斯分布不能有效的描述其概率特征。选择合适数目的高斯成分,根据GMM算法的建模步骤,关于xe的概率密度函数可以表示为:p(xe)=Σk=1KπkN(xe|μk,σk2)---(9)]]>通过建立EGMM模型可以计算得到相应的条件误差概率密度函数和相关的均值和方差:P(e|t)=P(xe)P(t)---(10)]]>μe|t=∫ΩeeP(e|t)de---(11)]]>σe|t2=∫Ωe(e-μe|t)2P(e|t)de---(12)]]>式中的t是输入得分向量,xe=[tT,e]T,P(xe)表示EGMM的联合概率密度函数。由于式(10)~(12)很难直接计算得到,本文选择数值解析法。对每个高斯成分...

【技术特征摘要】
1.基于EGMM的高斯过程回归软测量建模方法,其特征在于,该方法步骤为:
步骤1:收集输入输出数据组成历史训练数据库
步骤2:对输入和输出数据进行标准化处理,并用PCA进行信息提取得到得分矩阵。PCA算法为:
给定训练数据X∈Rn×m,m是过程变量的维数,n是训练数据的数目。PCA是在X的协方差矩阵基
础上实现的。一般情况下,可以通过奇异值分解(singular value decomposition,SVD)的方法建模PCA模型。
假设PCA模型有q个主成分,X可以被分解为如下形式:
X = TP T + T ~ ...

【专利技术属性】
技术研发人员:熊伟丽张伟薛明晨姚乐
申请(专利权)人:江南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1