当前位置: 首页 > 专利查询>江南大学专利>正文

基于模糊曲线分析的时间差高斯过程回归软测量建模方法技术

技术编号:12624600 阅读:121 留言:0更新日期:2015-12-31 17:58
本发明专利技术公开了一种基于模糊曲线分析的时间差高斯过程回归软测量建模方法,适合应用于具有时滞特性的化工过程。本方法能够从过程历史数据库中提取稳定的时滞信息,引入与主导变量序列更加相关的建模数据。首先,基于模糊曲线分析(FCA)的方法直观判断输入序列对于主导序列的重要性,估计过程时滞参数,用离线条件的时滞参数集对建模数据重构;对于新输入数据,基于一定时刻之前的历史变量值,采用时间差-高斯过程回归(TDGPR)模型对当前时刻主导变量值在线预测,该方法不存在模型更新的问题,可以很好地追踪输入输出漂移。本发明专利技术方法相比于稳态建模方法能够对关键变量进行更精准的预测,从而提高产品质量,降低生产成本。

【技术实现步骤摘要】
基于模糊曲线分析的时间差高斯过程回归软测量建模方法
本专利技术涉及基于模糊曲线分析的时间差高斯过程回归(FCA-TDGPR)的软测量建模方法,属于复杂工业过程建模和软测量领域。
技术介绍
在实际工业生产过程控制中,需要对一些关键变量进行严格的把关,以满足一系列质量控制要求,在现有的技术条件以及经济代价等问题的制约下直接获取关键变量十分困难。因此,软测量技术应运而生.它通过构造过程易测变量与难测变量之间的数学关系来推断和估计待测主导变量,用软件的方式进行“测量”。传统的软测量建模方法大多考虑零时延特性,即考虑输入输出具有同样的采样间隔,且在数据库中按时刻一一对应。然而,通过各个传感器采集的输入数据以及通过实验室分析或者在线仪表获得的输出数据间往往存在着显著的时间滞后,如果继续采用稳态情况下的建模方法,建立的模型已经不能完全解释过程的特性,不符合实际过程的因果关系。为了确保软测量模型能够在较长时间内实现关键变量的精确预测,有必要采取措施引入过程的时滞动态信息。本质上来说,现有的时滞估计方法大多数都在寻找与主导变量最密切相关的辅助变量用于建模,当投入实际应用中时,需要在算法复杂度与算法精度上取得折衷。针对过程时滞信息的估计问题,目前已有的方法包括互信息(MutualInformation,MI)方法、相关系数的方法等。本专利技术采用模糊曲线分析(FuzzyCurveAnalysis,FCA)的方法将变量时滞信息引入到软测量模型中,这种方法的特点是计算复杂度较低同时易于理解,能够直观有效地确定输入变量的重要性程度。为了对过程动态实时有效地进行跟踪和控制,软测量模型性能可以通过周期性地重建来维护,主要方法包括滑动窗(MovingWindow,MW)方法、迭代方法和实时学习(Just-in-timeLearning,JITL)方法,但是这些方法往往需要频繁地对所建模型进行更新,而时间差(TimeDifference,TD)模型不但能够处理随时间推移造成的模型性能下降,能取得更新模型般的追踪过程动态的效果,而且能够使得重建模型的可能性最小化。近年来,基于数据驱动的软测量建模方法得到了越来越多的关注。一些常用的软方法如偏最小二乘(partialleastsquares,PLS)、主成分分析(principalcomponentanalysis,PCA)等能够很好地处理输入变量和输出变量之间的线性关系,人工神经网络(artificialneuralnetworks,ANN)、支持向量机(supportvectormachine,SVM)、最小二乘支持向量机(leastsupportvectorsquaressupportvectormachine,LS-SVM)能够有效地处理过程的非线性关系。近年来,高斯过程回归(Gaussianprocessregression,GPR)作为一种非参数概率模型,不仅可以给出预测值,还可以得到预测值的不确定程度。故本专利技术选择GPR模型作为基本的软测量建模模型,结合TD思想来有效地处理过程输入输出的漂移。综上所述,建立一种考虑时滞问题的在线软测量模型,对于过程关键变量的严格控制有着重要的意义。
技术实现思路
对于时延过程,不考虑时滞的软测量模型不能够选取与主导变量序列最相关的辅助变量序列进行建模,采用这样的模型进行估计时,对主导变量的估计精度造成了很大影响。为了有效地提取出过程时滞信息,同时在不频繁更新模型的情况下建立在线的软测量模型,对关键变量的预测提供一种更为有效的在线策略。本专利技术提供一种基于FCA-TDGPR的软测量建模方法,该方法包括如下步骤:步骤1:收集过程的输入输出变量数据组成历史训练数据库,获取N组样本{X(t),y(t)},t=1,2,…,N,对数据进行预处理,根据过程机理及经验来确定各辅助变量中存在的最大的时滞参数Tmax;步骤2:对于每个原变量xi,i∈{1,2,…,m},分别扩展为含时滞的输入变量集{xi(t-λ),λ=0,1,…,Tmax},扩展方式为:步骤3:根据模糊曲线分析(FCA)方法确定含时滞输入变量集中每一个变量的重要性程度,确定最优的时滞变量xi(t-di),确定过程为:输入变量集{xi,i=1,2,…,m}及输出变量y,对于输入变量xi,t时刻采集的样本值记作xi(t),对于(xi(t),y(t)),输入变量xi的模糊隶属度函数定义为:对于每一个xi,{Φit,y(t)}提供了一条模糊规则,描述为{ifxiisΦit(xi),thenyisy(t)},Φit为变量xi关于第t个数据点的输入变量模糊隶属度函数,式(2)选取的是高斯模糊隶属度函数,b取变量xi值域范围的20%;故N个训练样本对应每个变量都有N条模糊规则,在模糊隶属度函数中,每个点对应的{xi(t),y(t)}处,有Φit=1;对于时延过程,通过引入时滞信息,原变量xi变为Tmax+1维,可表示为xi(t-λ),λ=0,1,…,Tmax,λ为引入的变量时延值;通过式(3)对扩展后的每个新变量质心去模糊化,可得到第i个变量时延值为λ条件下的模糊曲线Ci,λ;如式(4)所示,di为使模糊曲线Ci,λ覆盖范围最大的λ,Ci,λ(λ)max和Ci,λ(λ)min为模糊曲线上点值域的最大值和最小值;若得到的Ci,λ(λ)范围越接近y的范围,那么输入变量xi(t-λ)的重要程度越高,对Ci,λ(λ)覆盖范围进行排序,可以得到各自的重要性,由此得到最优时滞变量xi(t-di);步骤4:利用上一步分析得到的xi(t-di)构成时滞输入集Xd(t)=[x1(t-d1),x2(t-d2),…,xm(t-dm)]T,重建的软测量训练样本集为{Xd(t),y(t)},如果有新的输入样本X(t+1)到来,则基于历史数据库用同样参数进行重组,并转到步骤5,否则,等待新数据到来;步骤5:对重组训练集、重组的新数据进行j次时间差分处理,其中j的大小可根据过程的主导变量获得周期和性质确定,差分方式为:然后建立差分输入输出样本之间的高斯过程模型,高斯过程回归(GPR)算法为:给定训练样本集X∈Rm×N和y∈RN,m为输入变量维数,N为样本数目,输入和输出之间的关系满足:y=f(x)+ε(6)其中f是未知的函数形式,ε是均值为0,方差为的高斯噪声;对于一个新输入样本,相应的概率预测输出也满足高斯分布,联合高斯分布为K(X,X)为训练样本间的n维协方差方阵,是测试样本与训练样本的协方差向量,k(x*,x*)为测试样本的自协方差值,GPR可以选择不同的协方差函数描述样本分布特征,这里选择高斯协方差函数:其中,v是控制协方差函数的度量;高斯过程的超参数可通过极大似然估计得到:首先将参数Θgp设置为一个合理范围内的随机值,然后用共轭梯度法得到优化的参数,获得最优参数后,对于测试样本x*,可以用式(7)来估计GPR模型的输出值;步骤6:当t+1时刻的新输入数据到来时,且样本经过时滞信息重组后,采用时间差高斯过程回归(TDGPR)方法,基于yj(t+1-j)得到预测值yj,pred(t+1)的计算方式为:ΔXd,j(t+1)=Xd(t+1)-Xd(t+1-j)Δyj,pred(t+1)=fGPR(ΔXd,j(t+1))(10)yj,pr本文档来自技高网
...

【技术保护点】
基于模糊曲线分析的时间差高斯过程回归软测量建模方法,其特征在于,该方法步骤为:步骤1:收集过程的输入输出变量数据组成历史训练数据库,获取N组样本{X(t),y(t)},t=1,2,…,N,对数据进行预处理,根据过程机理及经验来确定各辅助变量中存在的最大的时滞参数Tmax;步骤2:对于每个原变量xi,i∈{1,2,…,m},分别扩展为含时滞的输入变量集{xi(t‑λ),λ=0,1,…,Tmax}。扩展方式为:步骤3:根据模糊曲线分析(FCA)方法确定含时滞输入变量集中每一个变量的重要性程度,确定最优的时滞变量xi(t‑di),确定过程为:输入变量集{xi,i=1,2,…,m}及输出变量y,对于输入变量xi,t时刻采集的样本值记作xi(t),对于(xi(t),y(t)),输入变量xi的模糊隶属度函数定义为:Φit(xi)=exp[-(xi(t)-xib)2]---(2)]]>对于每一个xi,{Φit,y(t)}提供了一条模糊规则,描述为{if xi isΦit(xi),then y is y(t)},Φit为变量xi关于第t个数据点的输入变量模糊隶属度函数,式(2)选取的是高斯模糊隶属度函数,b取变量xi值域范围的20%;故N个训练样本对应每个变量都有N条模糊规则,在模糊隶属度函数中,每个点对应的{xi(t),y(t)}处,有Φit=1;对于时延过程,通过引入时滞信息,原变量xi变为Tmax+1维,可表示为xi(t‑λ),λ=0,1,…,Tmax,λ为引入的变量时延值;通过式(3)对扩展后的每个新变量质心去模糊化,可得到第i个变量时延值为λ条件下的模糊曲线Ci,λ;如式(4)所示,di为使模糊曲线Ci,λ覆盖范围最大的λ,Ci,λ(λ)max和Ci,λ(λ)min为模糊曲线上点值域的最大值和最小值;Ci,λ(λ)=Σt=1NΦit[xi(t-λ)]·y(t)Σt=1NΦit[xi(t-λ)]---(3)]]>di=argmaxλ[Ci,λ(λ)max-Ci,λ(λ)min]---(4)]]>若得到的Ci,λ(λ)范围越接近y的范围,那么输入变量xi(t‑λ)的重要程度越高,对Ci,λ(λ)覆盖范围进行排序,可以得到各自的重要性,由此得到最优时滞变量xi(t‑di);步骤4:利用上一步分析得到的xi(t‑di)构成时滞输入集Xd(t)=[x1(t‑d1),x2(t‑d2),…,xm(t‑dm)]T,重建的软测量训练样本集为{Xd(t),y(t)},如果有新的输入样本X(t+1)到来,则基于历史数据库用同样参数进行重组,并转到步骤5,否则,等待新数据到来;步骤5:对重组训练集、重组的新数据进行j次时间差分处理(j的大小可根据过程的主导变量获得周期和性质确定),差分方式为:ΔXd,j(t)=Xd(t)‑Xd(t‑j)   (5)Δyj(t)=y(t)‑y(t‑j)然后建立差分输入输出样本之间的高斯过程模型,高斯过程回归算法为:给定训练样本集X∈Rm×N和y∈RN,m为输入变量维数,N为样本数目,输入和输出之间的关系满足:y=f(x)+ε   (6)其中f是未知的函数形式,ε是均值为0,方差为的高斯噪声;对于一个新输入样本,相应的概率预测输出也满足高斯分布,联合高斯分布为fgp|X,y,x*~N*(fgp‾,cov(fgp))]]>s.t.fgp‾=k(x*,X)[K(X,X)+σn2In]-1y---(7)]]>cov(fgp)=k(x*,x*)-k(X,x*)T[K(X,X)+σn2In]-1·k(X,x*)]]>K(X,X)为训练样本间的n维协方差方阵,k(x*,X)是测试样本与训练样本的协方差向量,k(x*,x*)为测试样本的自协方差值,GPR可以选择不同的协方差函数描述样本分布特征,本文选择高斯协方差函数:k(xp,xq)=vexp[-12Σd=1mπd(xpd-xqd)2]---(8)]]>高斯过程的超参数一般最简单的方法就是通过极大似然估计得到:L(Θgp)=-12yT[K(X,X)+σn2I]-1y-12logdet[K(X,X)+σn2I]-n2log2π---(9)]]>首先将参数Θgp设置为一个合理范围内的随机值,然...

【技术特征摘要】
1.基于模糊曲线分析的时间差高斯过程回归软测量建模方法,其特征在于,该方法步骤为:步骤1:收集过程的输入输出变量数据组成历史训练数据库,获取N组样本{X(t),y(t)},t=1,2,…,N,对数据进行预处理,根据过程机理及经验来确定各辅助变量中存在的最大的时滞参数Tmax;步骤2:对于每个原变量xi,i∈{1,2,…,m},分别扩展为含时滞的输入变量集{xi(t-λ),λ=0,1,…,Tmax},扩展方式为:步骤3:根据模糊曲线分析(FCA)方法确定含时滞输入变量集中每一个变量的重要性程度,确定最优的时滞变量xi(t-di),确定过程为:输入变量集{xi,i=1,2,…,m}及输出变量y,对于输入变量xi,t时刻采集的样本值记作xi(t),对于(xi(t),y(t)),输入变量xi的模糊隶属度函数定义为:对于每一个xi,{Φit,y(t)}提供了一条模糊规则,描述为{ifxiisΦit(xi),thenyisy(t)},Φit为变量xi关于第t个数据点的输入变量模糊隶属度函数,式(2)选取的是高斯模糊隶属度函数,b取变量xi值域范围的20%;故N个训练样本对应每个变量都有N条模糊规则,在模糊隶属度函数中,每个点对应的{xi(t),y(t)}处,有Φit=1;对于时延过程,通过引入时滞信息,原变量xi变为Tmax+1维,可表示为xi(t-λ),λ=0,1,…,Tmax,λ为引入的变量时延值;通过式(3)对扩展后的每个新变量质心去模糊化,可得到第i个变量时延值为λ条件下的模糊曲线Ci,λ;如式(4)所示,di为使模糊曲线Ci,λ覆盖范围最大的λ,Ci,λ(λ)max和Ci,λ(λ)min为模糊曲线上点值域的最大值和最小值;若得到的Ci,λ(λ)范围越接近y的范围,那么输入变量xi(t...

【专利技术属性】
技术研发人员:熊伟丽李妍君薛明晨
申请(专利权)人:江南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1