一种基于域适应图网络的发酵过程软测量建模方法技术

技术编号:38816457 阅读:15 留言:0更新日期:2023-09-15 19:55
一种基于域适应图网络的发酵过程软测量建模方法,所述方法包括以下步骤:(1)数据的获取和分析:通过青霉素仿真软件获得不同批次数据;(2)输入变量选择:选择和输出变量具有高相关的输入变量;(3)建模训练:构建基于DAGCN的过程软测量模型;(4)模型性能评估:基于目标域测试数据评估模型性能。本发明专利技术方法在提取过程变量关系的同时,进一步基于微调技术适应了不同批次之间的非线性差异,提高了模型的使用范围。围。围。

【技术实现步骤摘要】
一种基于域适应图网络的发酵过程软测量建模方法


[0001]本专利技术涉及发酵过程的产品质量预测领域,特别涉及一种基于域适应图网络的发酵过程软测量建模方法。

技术介绍

[0002]青霉素发酵过程是一种典型的生化反应过程,主要指青霉素菌体在不同环境下进行生长和合成抗生素的代谢活动。发酵过程具有很强的时变性及非线性。作为一种典型的间歇过程,具有多批次特性。但由于产品生命周期的有限性以及成本投入的经济效益,产品质量的在线测量存在较大困难。数据驱动的软测量方法由于低成本和低延迟的特性,已逐渐替代昂贵费时的离线测量方法,并在过程产品的关键质量预测领域广泛使用。
[0003]基于深度学习的数据驱动方法在历史数据挖掘方面已表现出较好的能力,例如卷积神经网络和自编码器。大多数的应用假设训练数据和测试数据具有相似的过程特性。但是青霉素发酵的间歇过程通常会改变操作条件或原料配比以生产各种规格的产品。由于过程之间的非线性差异,特定过程建立的模型在不同过程的预测性能会趋于下降。而新的过程重新收集标记数据训练模型的过程又费时费力,导致无法建立可靠的软测量模型。
[0004]基于迁移学习的域适应软测量方法已逐渐应用于间歇过程,该方法放宽了对过程非线性差异和标签数据量的限制,并旨在迁移相关领域的数据知识辅助当前领域建模。但现有研究通常存在一定的缺陷:它们忽略了变量之间的关系,而是直接将他们封装为抽象特征,一定程度上限制了模型的应用。
[0005]图神经网络作为深度学习的一个分支,可以学习具有图结构的数据信息,这有助于理解不同节点之间的关系。而作为传统图神经网络的一种变体,图卷积网络(Graph Convolution Network,GCN)通过对结构数据进行卷积运算,体现了强大的表示能力。然而目前GCN在过程工业中的应用却比较有限,特别在间歇过程,如何更好地适应间歇过程的批次间非线性差异,建立适用于批次切换过程的域适应模型却缺乏研究。

技术实现思路

[0006]针对现有技术中存在的上述问题,本专利技术提出了基于域适应的图卷积(Deep Adaption Graph ConvolutionNetwork,DAGCN)方法来进行青霉素发酵过程的软测量建模。DAGCN考虑了变量之间的拓扑结构和过程的时序特性,并旨在利用相关过程的数据信息,扩大模型的使用范围。具体建模流程如下:首先基于GCN对相关过程数据进行建模来捕捉数据的拓扑结构信息,其中变量的关系矩阵由模型端到端进行训练。加入采集的时间信息以捕捉过程的时序特性。全连接层学习过程变量和输出变量之间的映射关系,最后基于当前批次的少量数据微调全连接层的参数,扩大了模型的使用范围。在青霉素发酵的间歇过程中表明提出的模型具有较好的性能。
[0007]本专利技术解决其技术问题所采用的技术方案是:
[0008]一种基于域适应图网络的发酵过程软测量建模方法,所述方法包括以下步骤:
[0009](1)数据的获取和分析
[0010]通过青霉素仿真软件获得不同批次数据。
[0011](2)输入变量选择
[0012]选择和输出变量之间相关性较大的输入变量作为模型输入。
[0013](3)建模训练
[0014]构建基于DAGCN的过程软测量模型。
[0015](4)模型性能评估
[0016]基于目标域测试数据评估模型性能。
[0017]进一步,所述步骤(1)的过程为:
[0018]步骤1.1:通过仿真软件Pensim模拟青霉素发酵过程的不同反应条件,具体发酵过程的可变变量为:时间(Time,t)、通气速率(Aeration Rate,AR)、搅拌器功率(Agitator Power,AP)、底物进给温度(Substrate Feed Temperature,T
SF
)、底物浓度(Substrate Concentration,E
S
)、溶解氧浓度(Dissolved Oxygen Concentration,E
DO
)、容器容积(Vessel Volume,V
V
)、二氧化碳浓度(CO2Concentration,E
CO2
)、溶液的酸碱度PH、发酵产生温度(Generated Temperature,T
G
)等,输出变量为青霉素浓度(Penicillin Concentration,E
P
)。为了符合真实生产过程,在过程中添加2%的高斯噪声。最终得到三种不同批次特性的青霉素发酵过程,分别记为批次G1、G2、G3。
[0019]步骤1.2:将不同批次数据划分为源域和目标域数据,其中源域具有足量标记数据,而目标域只拥有少量标记数据。
[0020]步骤1.3:由于不同输入变量之间具有量纲的差异,因此需要对数据进行标准化处理,具体公式如下所示:
[0021][0022]其中,X是未经标准化处理的原数据,X'是经标准化处理后的数据,μ、δ分别是数据的均值和标准差。
[0023]进一步,所述步骤(2)的过程为:
[0024]基于两个变量的互信息(Mutual Information,MI)相关性来衡量源域输入变量x和输出变量y之间的相互依赖性,具体计算如下:
[0025][0026]其中P(x)、P(y)是单个变量x、y的边缘概率密度函数,I(x,y)、P(x,y)分别是两者的MI系数和联合概率密度函数。具体MI值越大表明变量之间的相关性则越高。
[0027]进一步,所述步骤(3)的过程为:
[0028]步骤3.1:基于MI排序变量,并选择主要过程变量作为模型的输入。使用源域数据训练GCN模块,具体图卷积运算经过变体可表示为:
[0029][0030]其中GCN(X
Θ
,A)表示图卷积操作,D

1/2
AD

1/2
为图卷积核,D=∑
j
A
j
为邻接矩阵A的
度矩阵,X
Θ
表示表示特征矩阵,其中H表示批次数量,C表示通道数,P表示时间步,V表示变量个数。I表示单位矩阵,conv(.)表示卷积操作,σ(.)是激活函数,W是权重矩阵。
[0031]为了减少特征位置对于预测变量的影响,将GCN提取到的特征输入到全连接层模块(Fully Connected Layers,FCL)中,学习过程特征和输出变量之间的映射关系。
[0032]利用根均方误差(Root Mean Square Error,RMSE)作为模型损失,而为了学习更具泛化性能的邻接矩阵A,加入元素层面熵的约束,用于鼓励结构离散,具体的损失公式如下:
[0033][0034]L(A)=

Alog2(A)

(1

A)log2(1

A)
[0035]其中y本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于域适应图网络的发酵过程软测量建模方法,其特征在于所述方法包括以下步骤:(1)数据的获取和分析:通过青霉素仿真软件获得不同批次数据;(2)输入变量选择:选择和输出变量之间相关性较大的输入变量作为模型输入;(3)建模训练:构建基于DAGCN的过程软测量模型;(4)模型性能评估:基于目标域测试数据评估模型性能。2.如权利要求1所述的一种基于域适应图网络的发酵过程软测量建模方法,其特征在于,所述步骤(1)的过程如下:步骤1.1:获得发酵过程的不同批次数据;步骤1.2:将数据划分为源域和目标域数据;步骤1.3:对数据进行标准化处理。3.如权利要求1或2所述的一种基于域适应图网络的发酵过程软测量建模方法,其特征在于,所述步骤(2)的过程如下:基于两个变量的互信息MI相关性来衡量源域输入变量x和输出变量y之间的相互依赖性,具体计算如下:其中P(x)、P(y)是单个变量x、y的边缘概率密度函数,I(x,y)、P(x,y)分别是两者的MI系数和联合概率密度函数;具体MI值越大表明变量之间的相关性则越高。4.如权利要求1或2所述的一种基于域适应图网络的发酵过程软测量建模方法,其特征在于,所述步骤(3)的过程如下:步骤3.1:将基于MI选择的过程变量作为模型的输入,并由源域数据训练GCN模块,具体图卷积运算经过变体可表示为:其中GCN(X
Θ
,A)表示图卷积操作,D

1/2
A...

【专利技术属性】
技术研发人员:刘毅朱佳良邓鸿英
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1