基于最大二次互信息准则回归的发酵过程质量变量预测制造技术

技术编号:23471208 阅读:45 留言:0更新日期:2020-03-06 13:04
本发明专利技术公开了一种基于最大二次互信息准则回归的发酵过程质量变量预测方法。实际生产中,反映最终产品质量的关键质量变量通常难以在线测量。目前常采用的离线测量法会导致滞后和精度不足等问题,影响产量及质量的一致性。本发明专利技术针对发酵生产数据强非线性、非高斯性的特点,提出一种基于最大二次互信息准则的回归方法,实现对发酵过程关键质量变量的预测。与MPLS等基于二阶统计量的回归方法相比,本发明专利技术使用高阶统计量进行过程变量与关键质量变量之间的回归,挖掘过程变量与关键质量变量之间的非线性依赖关系,且本发明专利技术无需假设数据服从高斯分布。相关实验表明,与MPLS方法相比,本发明专利技术预测效果更优。

Prediction of quality variables in fermentation process based on maximum quadratic mutual information criterion regression

【技术实现步骤摘要】
基于最大二次互信息准则回归的发酵过程质量变量预测
本专利技术涉及基于数据驱动的回归预测方法领域,特别是涉及一种基于针对发酵生产数据的最大二次互信息准则回归方法。
技术介绍
间歇过程是现代工业生产的重要生产方式。间歇过程广泛存在于生物制药、食品加工、化工、半导体生产等领域,最大的特征是小批量、高附加值、多规格和高品质。发酵过程是典型的间歇生产过程。我国生物发酵行业产业规模不断扩大,已成为我国战略性新兴产业中的重要组成部分。近年来增强生物发酵产业的自主创新能力,推动高新技术改造传统制造技术,已经成为生物发酵产业的研究热点。在实际发酵生产过程中,一些可以反映最终产品质量的关键质量变量通常难以在线测量,如菌体浓度、产物浓度、葡萄糖浓度等。目前,这些变量大都只能离线测量,即在生产现场取样后拿到实验室进行分析测量。这样会导致滞后和精度不足等问题,影响发酵过程的产量及质量的一致性。随着传感器技术、智能仪表及计算机技术的迅速发展,生产中积累了大量的过程数据,如温度、压力及通风速率等。通过使用多元统计分析等数据驱动的方法,挖掘可测量的过程数据所包含的有用信息,实现对难以测量的变量的预测,已成为经济可靠、响应迅速的解决方式。目前,以偏最小二乘回归(MultiwayPartialleastsquares,MPLS)及主成分回归(Principalcomponentregression,PCR)为代表的多元统计回归模型在间歇过程的关键质量变量预测中得到广泛应用。发酵过程的动力学模型呈现高度的非线性,因此难以建立精确的数学模型。发酵过程呈现出较强的时变性,过程的动力学特征随着发酵时间或批次不同而不断变化。此外,发酵生产数据多为高斯和非高斯的混合分布。然而,MPLS及PCR都是基于二阶统计量的方法,通过最大化方差、最大化相关性来提取特征,同时需要假设数据服从高斯分布。互信息(Mutualinformation)可以衡量数据分布之前的非线性相互依赖性,通过数据的概率分布提取高阶统计量。互信息在特征选择和特征提取领域得到广泛应用。为了便于计算,一些学者提出二次互信息(Quadraticmutualinformation,QMI)的概念。QMI将二次Renyi熵与Parzen窗密度估计方法巧妙结合,提供了有效的、便捷的计算数据集之间非线性依赖关系的方法。
技术实现思路
本专利技术针对发酵过程数据强非线性、非高斯性的特点,提出一种基于最大二次互信息准则的回归方法,实现对发酵过程关键质量变量的预测。本专利技术无需假设数据服从高斯分布,通过二次互信息提取过程变量与关键质量变量之间的非线性关系,提高预测精度。本专利技术的总体设计方案为:首先,将高维的原始过程数据(输入空间)进行线性映射到低维的特征空间。如图1所示,通过定义目标函数,使得特征与关键质量变量(输出)之间的二次互信息最大,同时使输入空间的Renyi熵也尽量保持最大。然后,使用梯度下降法求取最优线性变换。最后,建立原始过程数据与关键质量变量之间的线性回归模型,对新样本时刻的关键质量变量进行预测。本专利技术采用如下的技术方案及实现步骤:1、基于最大二次互信息准则回归的发酵过程质量变量预测,其特征在于:包括以下步骤:A.离线建模阶段:1)三维数据展开;正常发酵生产中采集到的三维过程数据可表示为Xo(I×M×K),其中I为批次数,M为过程变量个数,K为采样时刻数,首先对其进行变量展开,经过变量展开后得到二维矩阵Xv(N×M),其中N=KI;对于采集到的三维关键质量变量矩阵进行相同的处理,得到Yv(N×L),其中L为关键质量变量的个数;最后对Xv和Yv进行转置运算,得到X=XvT=[x1,…,xN]及Y=YvT=[y1,…,yN];2)数据标准化;对X和Y进行标准化处理,求取每一行的均值和标准差;X的均值为:其中X的标准差为:Xstd=[xs1,...,xsi,xsM]T(2)其中对Y进行标准化处理,得到Y的均值为:其中Y的标准差为:Ystd=[ys1,...,ysi,ysL]T(4)其中3)依据Silverman’srule计算使用Parzen窗进行密度估计时所需的核函数,包括σx,σt与σy;首先计算标准化后X的协方差矩阵Σ,令其中σii为协方差矩阵Σ对角线上元素;依据Silverman’srule:其中r为对X进行线性变化后特征空间的维数;4)目标函数J(W)的定义及计算;对X进行线性变换T=WTX,其中W是M×r(r<M)维变换矩阵,W的每一列为一个投影轴;T为变换后的特征空间,ti(i=1,…,N)为xi在特征空间的特征向量;即目标函数定义为:J(W)=-HR2(T)-α·QMIED(T,Y)(9)其中HR2(T)是T的二次Renyi熵,QMIED(T,Y)是X与Y之间的基于欧式距离的二次互信息,α是权重系数,J(W)取得最小值,即W=W*时,T与Y之间的二次互信息最大,同时使T的二次Renyi熵也尽量保持最大;使用Parzen窗对HR2(T)和QMIED(T,Y)进行计算;首先令高斯核函数记为:然后使用Parzen窗对HR2(T)和QMIED(T,Y)分别进行估计,计算方法如下:QMIED(T,Y)=VE=VJ+VM-2VC5)使用梯度下降法求取W*;随机初始化W,使用3)4)中相关公式计算此时J(W);使用对W值进行更新,再计算J(W),其中,以此反复进行迭代计算,直到达到终止条件为止,其中λ为学习速率;终止条件可以设置为达到最大迭代次数或J(W)收敛至某精度;6)建立回归模型;由5)求得W*,此时T=W*TX;则T与Y之间的回归系数为:θ=(TTT)-1TYT;B.在线预测阶段:1)样本预处理;对于采集到的新样本xnew,对其进行正则化处理:其中xnew,i表示xnew的第i个分量;同理Xaver,i表示Xaver的第i个分量,Xstd,i表示Xstd的第i个分量;2)使用回归模型进行预测ynew=θTW*Txnew(14)3)将ynew映射回原始输出空间,求取最终预测结果yp,i=ynew,i·Ystd,i+Yaver,i(i=1,…,L)(15)yp,i表示yp的第i个分量,Yaver,i表示Yaver的第i个分量,Ystd,i表示Ystd的第i个分量。有益效果本专利技术针对发酵过程数据强非线性、非高斯性的特点,提出一种基于最大二次互信息准则的回归方法,实现对发酵过程中难以控制的关键质量变量的预测,提高预测精度。与现有的技术PLS或PCR相比,本专利技术无需假设数据服从高斯分布。而且,本专利技术依据高阶统计量,即二次互信息,提取过程变量与关键质量变量之间的非线性依赖关系,与仅考虑二阶统计量、提取线性相关性的MPLS或PCR方法相比,本文档来自技高网
...

【技术保护点】
1.基于最大二次互信息准则回归的发酵过程质量变量预测,其特征在于:包括以下步骤:/nA.离线建模阶段:/n1)三维数据展开;正常发酵生产中采集到的三维过程数据可表示为X

【技术特征摘要】
1.基于最大二次互信息准则回归的发酵过程质量变量预测,其特征在于:包括以下步骤:
A.离线建模阶段:
1)三维数据展开;正常发酵生产中采集到的三维过程数据可表示为Xo(I×M×K),其中I为批次数,M为过程变量个数,K为采样时刻数,首先对其进行变量展开,经过变量展开后得到二维矩阵Xv(N×M),其中N=KI;对于采集到的三维关键质量变量矩阵进行相同的处理,得到Yv(N×L),其中L为关键质量变量的个数;最后对Xv和Yv进行转置运算,得到X=XvT=[x1,…,xN]及Y=YvT=[y1,…,yN];
2)数据标准化;对X和Y进行标准化处理,求取每一行的均值和标准差;X的均值为:



其中X的标准差为:
Xstd=[xs1,...,xsi,xsM]T(2)
其中对Y进行标准化处理,得到Y的均值为:



其中Y的标准差为:
Ystd=[ys1,...,ysi,ysL]T(4)
其中
3)依据Silverman’srule计算使用Parzen窗进行密度估计时所需的核函数,包括σx,σt与σy;首先计算标准化后X的协方差矩阵Σ,令其中σii为协方差矩阵Σ对角线上元素;依据Silverman’srule:









其中r为对X进行线性变化后特征空间的维数;
4)目标函数J(W)的定义及计算;对X进行线性变换T=WTX,其中W是M×r(r<M)维变换矩阵,W的每一列为一个投影轴;T为变换后的特征空间,ti(i=1,…,N)为xi在特征空间的特征向量;即



目标函数定义为:
...

【专利技术属性】
技术研发人员:王普李征高学金高慧慧
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1