当前位置: 首页 > 专利查询>江南大学专利>正文

改进自适应仿射传播聚类的多模型软测量方法技术

技术编号:13634510 阅读:82 留言:0更新日期:2016-09-02 19:28
本发明专利技术公开了一种改进自适应仿射传播聚类的多模型软测量方法。用于具有多工况特征的化工生产过程。该方法利用差分进化算法对自适应仿射传播聚类算法进行改进,对偏置参数和阻尼系数进行局部范围内寻优,划分得到更优的子数据集,并建立各个高斯过程回归子模型。当新的数据到来时,利用基于子模型预测性能的贝叶斯融合方法自适应地计算出当前数据隶属于各个子模型的后验概率,并对各子模型的预测值进行融合得到最终输出,实现对生产过程中关键变量的精确预测,从而降低生产成本,提高产品质量。

【技术实现步骤摘要】

本专利技术涉及的改进自适应仿射传播聚类的多模型软测量方法,属于复杂工业过程建模和软测量领域。
技术介绍
工业生产过程的复杂程度正在日益增加,往往伴随着多工况、非线性和时变等过程特征,其相应的计算机控制系统也在不断地升级和完善,同时推动了基于数据驱动理论的软测量建模方法的发展。常见的建模方法如偏最小二乘法(Partial Least Squares,PLS)、人工神经网络(Artificial Neural Networks,ANN)、最小二乘支持向量机(Least Squares Support Vector Machine,LSSVM)等都可以得到良好的预测效果。高斯过程回归(Gaussian Process Regression,GPR)鉴于其具有预测精度高、输出具有概率意义的优点,近几年被广泛应用于软测量建模。对于实际的工业生产过程,一般的单模型软测量方法无法对复杂工况进行比较全面的描述,模型的预测效果也往往不理想。多模型建模方法通过对复杂系统进行工况划分并建立相应的子模型,能对主导变量进行比较准确的预测,有效地提高了模型的预测精度和泛化性能。在多模型建模过程中,将建模数据进行准确聚类是保证所建模型预测性能的前提,对具有多工况特征的生产过程建模具有重要意义。传统的聚类算法,如模糊C均值、k-means等对初始聚类中心的选取较敏感,并不能保证聚类的质量。仿射传播(Affinity Propagation,AP)聚类是一种新型的聚类算法,聚类初始时将所有数据点作为潜在的聚类中心,聚类过程中各数据点迭代竞争聚类中心,得到的聚类结果与数据的真实特性更加吻合。但在传统的AP算法中,偏置参数的确定缺乏理论依据,在没有先验知识的情况下,偏置参数一般取相似度矩阵的中值或最小值。因此,偏置参数的确定成为研究AP算法的重要问题。在预测最终输出时,组合各个局部模型输出的方式对模型预测结果也具有重要影响。目前,组合方式主要分为两种:“开关切换”方式和“加权融合”方式。前者只选择可能性最大的局部模型预测最终输出,很难对操作阶段过渡过程的动态特性进行有效描述;此外,相对“加权融合”方式,可以认为“开关切换”方式是一种使小概率模型权重为0的特殊情况。因此,在实际建模过程中,“加权融合”方式得到了越来越广泛的关注和应用。
技术实现思路
针对具有多工况特征的工业生产过程,为提高产品的质量,对生产过程进行监控,本文提供了一种可对生产过程中难测得参数进行准确预测的多模型软测量建模方法。利用改进自适应AP算法对训练样本进行聚类,划分得到具有较好结构的子数据集并建立各GPR子模型,对于新来的样本,利用贝叶斯方法对各子模型的预测值进行融合,实现对工业生产过程中难测变量的准确预测,降低成本,提高产品质量。本专利技术是通过以下技术方案实现的:利用自适应AP算法确定偏置参数近似值,并基于此近似值,将BWP指标作为目标函数,利用差分进化算法对偏置参数和阻尼系数进行局部范围内寻优,将所求参数代入AP算法对训练样本进行聚类,划分得到更优的子数据集,并建立各个GPR子模型;对于新来的样本,利用基于子模型预测性能的贝叶斯方法自适应地计算出当前样本隶属于各子模型的后验概率,并对各子模型进行融合,得到最终的全局预测模型,从而可以实现一些工业过程关键变量的软测量。附图说明图1是改进自适应AP聚类的多模型软测量流程图;图2是训练样本的类别归属情况;图3是Ns不同取值时两种建模方法的均方根误差;图4是青霉素浓度预测输出结果;图5是几种建模方法的预测误差;图6是测试样本隶属于各个操作阶段的后验概率;具体实施方式青霉素发酵是典型的微生物发酵过程,其发酵过程受多种因素影响,而且具有明显的阶段性和高度的非线性等特征,建立精确的软测量模型对优化该生化发酵过程具有重要的意义。选取溶解氧浓度、生物量浓度、基质浓度、二氧化碳浓度、PH值、空气流量6个参数作为输入变量,以发酵过程中青霉素的浓度作为输出变量。下面结合图1所示,对本专利技术做进一步详述:步骤1:收集输入输出数据,组成训练样本数据库。步骤2:利用改进的自适应仿射传播聚类算法(Affinity Propagation,AP)确定偏置参数和阻尼系数值,并将所求参数代入AP算法,对训练样本进行聚类,得到具有较好结构的子数据集,图2为两种聚类方法对训练样本划分所得的结果。所述改进自适应AP算法为:AP是一种基于样本相似度矩阵S进行聚类的算法。给定训练样本集D={(xi,yi)本文档来自技高网
...

【技术保护点】
改进自适应仿射传播聚类的多模型软测量方法,其特征在于,该方法步骤为:步骤1:收集输入输出数据,组成训练样本数据库。步骤2:利用改进的自适应仿射传播聚类算法(Affinity Propagation,AP)确定偏置参数和阻尼系数值,并将所求参数代入AP算法,对训练样本进行聚类,得到具有较好结构的子数据集。所述改进自适应AP算法为:AP是一种基于样本相似度矩阵S进行聚类的算法。给定训练样本集D={(xi,yi)},i=1,2,...,n,定义任意两个样本xi和xk之间的相似度为欧式距离平方的负值,即S(i,k)=‑||xi‑xk||2。相似度矩阵主对角线上的元素S(k,k)称作偏置参数。同时,AP算法引入了两个证据参数,证据R(i,k)描述点k作为点i的聚类中心的适合程度,证据A(i,k)描述点i对点k作为其聚类中心的适合程度。迭代更新公式分别为:R(i,k)=S(i,k)-maxj:j≠k{A(i,j)+S(i,j)}---(1)]]>A(i,k)=min{0,R(k,k)+Σj:j∉{i,k}max{0,R(j,k)}}---(2)]]>为避免在迭代过程中发生震荡,在更新过程中引入阻尼系数λ,更新公式如下:Rnew(i,k)=(1‑λ)R(i,k)+λRold(i,k)   (3)Anew(i,k)=(1‑λ)A(i,k)+λAold(i,k)   (4)式中,Rnew(i,k)和Anew(i,k)为当前迭代的值,Rold(i,k)和Aold(i,k)分别为前一次迭代的值。Step1:针对训练样本聚类数目已知的情况,利用自适应AP算法,通过建立偏置参数p和指定聚类数目K的关系,求得偏置参数的近似值。Step2:将BWP指标作为目标函数,用差分进化算法对偏置参数和阻尼系数进行局部范围内寻优,从而得到更好的聚类结果。优化问题可表述为:maxBWP(X),X={X1,X2,...,XK}s.t.pα+βpα<p<pα-βpα;05<λ<0.9---(5)]]>式中,X1,X2,...,XK为聚类所得的K个子数据集,pα为Step1中求得的偏置参数值,β为缩放因子,可根据不同应用进行调整。上述BWP指标是一种新的聚类评价指标,可对聚类划分所得数据集的类内紧密性和类间可分性进行综合分析与评价,计算公式为:BWP=1nΣj=1KΣi=1njbdij-wdijbdij+wdij---(6)]]>式中,n为数据总数,K为聚类数目,nj为第j类的数据个数;为第j类的第i个数据到其他每个类中数据平均距离的最小值;为第j类的第i个数据到第j类中其他所有数据的平均距离。Step3:将Step2中求得的偏置参数和阻尼系数值代入AP算法,对数据集进行聚类,即可得到具有较好聚类结构的子数据集。步骤3:根据步骤2划分得到的子数据集,建立各个高斯过程回归(Gaussian Process Regression,GPR)子模型。给定训练样本集D={(xi,yi)},i=1,2,...,n,其中xi∈RD,yi∈R,i=1,2,...,n,分别代表D维输入和1维输出数据,n为训练样本个数。对于一个新来数据x*,可以得到预测输出的均值和方差,分别为:y*(x*)=k*TC‑1y   (7)σy*2(x*)=k-k*TC-1k*---(8)]]>式中,k*=[k(x*,x1),...,k(x*,xn)]T是训练样本和测试输入之间的n×1维协方差矩阵,是训练样本之间的n×n维协方差矩阵,表示噪声方差,k是测试输入和自身的协方差。k(xi,xj)=vexp[-12Σd=1Dωd(xid-xjd)2]---(9)]]>式中,v表示先验知识的总体度量,ωd代表每个成分xd的相关性程度。上述协方差函数确定后,需要对未知参数进行估计,一般通过极大似然估计求解:L(θ)=-12log(det(C))-12yTC-1y-n2log(2π)---(10)]]>可先将θ设为一个合理范围内的随机值,然后用共轭梯度法来搜索参数的最优值。求得参数后,对于新来的样本x*,通过公式(7)(8)即可得到相应的输出值。步骤4:利用基于子模型预测性能的贝叶斯融合算法自适应地计算出各子模型的权重。对于新来的样本xnew,基于贝叶斯定理,最终的预测结果可以表示为:y^new=Σk=1KP(SMk|xnew)y^new,k---(11)]]>式中,为最终的预测输出,P(SMk|xnew)为xnew隶属于第k个子模型的后验概率,为第k个子模型对xn...

【技术特征摘要】
1.改进自适应仿射传播聚类的多模型软测量方法,其特征在于,该方法步骤为:步骤1:收集输入输出数据,组成训练样本数据库。步骤2:利用改进的自适应仿射传播聚类算法(Affinity Propagation,AP...

【专利技术属性】
技术研发人员:熊伟丽葛祥振李妍君
申请(专利权)人:江南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1