一种基于时序图网络的发酵过程软测量建模方法技术

技术编号:35979933 阅读:73 留言:0更新日期:2022-12-17 22:50
一种基于时序图网络的发酵过程软测量建模方法,属于发酵过程软测量技术领域。它包括以下步骤:(1)数据的获取和整合:获取不同工况下的青霉素发酵过程,对数据进行划分、收集和整合;(2)数据选择:对数据进行选择,去除冗余无用的数据并建立变量之间因果图;(3)建模训练:构建算法模型,并进行学习训练;(4)模型预测:使用训练后的算法模型进行预测,并给出预测结果。本发明专利技术提出了一种基于时序图网络的发酵过程软测量建模方法,提高了发酵过程关键产品质量的预测准确度;本方法利用图卷积网络和长短期记忆,在时间和空间维度上对数据进行提取,增加了模型的泛化性;本方法可以对不同发酵过程的关键产品质量进行精准测量。酵过程的关键产品质量进行精准测量。酵过程的关键产品质量进行精准测量。

【技术实现步骤摘要】
一种基于时序图网络的发酵过程软测量建模方法


[0001]本专利技术属于发酵过程软测量领域,具体涉及一种基于时序图网络的发酵过程软测量建模方法。

技术介绍

[0002]发酵过程是有生物参与并在合适的PH值、温度、搅拌等发酵条件下生成目标产物的过程,广泛的存在于各种工业过程中,有固有的强非线性和机理过程的复杂性。其理论建模和过程控制都存在较大困难,尤其是缺乏合适的在线传感器来在线分析关键产品质量,如青霉素发酵过程中的关键产品质量,只能偶尔以离线的方式进行分析,这在很大程度上限制了发酵过程的控制和优化。
[0003]随着数据驱动建模的方法在工业过程中体现出巨大优势,同时为了克服难以分析关键产品质量的问题,越来越多的人采用数据驱动建模的方法从其他可在线测量的变量中来估计关键产品质量。发酵过程由于其产品质量和操作变量之间存在强非线性,因此基于发酵过程的数据驱动建模方法主要分为统计方法、浅层机器学习方法和深度学习方法。其中,统计方法主要包括主成分分析(Principal ComponentAnalysis,PCA)、偏最小二乘法(Partial Least squares,PLS)。浅层机器学习方法是指深度学习以外的传统机器学习模型,包括浅层人工神经网络(Artificial Neural Network,ANN)、支持向量机(SupportVectorMachine,SVM)、高斯过程模型(Gaussian Process Model,GPM)。深度学习主要包括各种三层以上的深度神经网络,如长短期记忆(Long Short

Term Memory,LSTM),深度神经网络已经被证明能够逼近任何非线性系统并广泛应用于过程建模中。
[0004]最近,图神经网络(GraphNeural Network,GNN)作为深度学习的一个分支,在许多领域表现出优越的性能。作为传统GNN的一种变体,图卷积网络(Graph Convolution Network,GCN)通过对结构数据进行卷积运算,体现了强大的表示能力。

技术实现思路

[0005]针对现有技术中存在的上述问题,本专利技术的目的在于提供一种基于时序图网络的发酵过程软测量建模方法,能够提高发酵过程关键产品质量的预测效果。
[0006]本专利技术提供如下技术方案:一种基于时序图网络的发酵过程软测量建模方法,所述方法包括以下步骤:
[0007](1)数据的获取和整合
[0008]使用仿真平台InPenSim获取不同工况下的青霉素发酵过程,并且以一小时为一批次对数据进行划分、收集和整合。
[0009](2)数据选择
[0010]根据格兰杰因果检测(Granger Causality Test,GC Test)对数据进行选择,去除冗余无用的数据并建立变量之间因果图。
[0011](3)建模训练
[0012]构建基于时序图网络的发酵过程软测量建模方法的图长短期记忆 GraphLSTM(Graph long short

term memory)算法模型,模型的输入为经过选择保留的数据与变量之间的因果连接矩阵;然后利用图长短期记忆GraphLSTM模型对所整合的数据进行学习训练。
[0013](4)模型预测
[0014]将训练后的图长短期记忆GraphLSTM模型用于青霉素发酵过程产物出口浓度预测,并给出预测结果。
[0015]进一步,所述步骤(1)的过程为:
[0016]步骤1.1:设定InPenSim仿真过程,获得仿真平台36个变量的输出数据。
[0017]步骤1.2:将数据根据3:2:1的比例划分成训练集、验证集和测试集。
[0018]步骤1.3:由于不同变量之间数据差异性较大,因此有必要对数据进行标准化处理,以便于模型进行处理和运算,具体公式如下所示:
[0019][0020]其中,X

是经标准化处理后的数据,X是未经标准化处理的原数据,μ是数据的均值,σ是数据的标准差。
[0021]进一步,所述步骤(2)的过程为:
[0022]步骤2.1:使用格兰杰因果检测进行数据变量选择,首先可以建立两种不同的自回归模型来评估格兰杰因果关系:
[0023][0023][0024]其中,a
1i,l
(i=1,2)和b
11,l
是自回归模型的系数;ε
1(t)
和ε
1(2)(t)
分别是完整模型和简化模型的预测误差;p是自回归模型的顺序,即模型所涉及的时间滞后;J是过程变量的总数,x
j(t)
(j=3,4,...,J)表示在第t个采样时间点第j个变量的观测值。
[0025]步骤2.2:做出零假设H0:F
X2

X1
=0和备选假设H1:F
X2

X1
>0。如果拒绝零假设,则F检测意味着X2对X1存在格兰杰因果关系。可以采用如下定义的F统计来检验该假设:
[0026][0027]其中R0和R1分别是公式(2)中两个模型的残差平方和,N是样本大小,p为置信边界。如果统计量大于从F分布得出的临界值,则拒绝零假设。
[0028]步骤2.3:根据格兰杰因果检测的p值对变量进行排序完成变量选择过程。
[0029]步骤2.4:根据格兰杰因果检测的p值建立变量之间的因果关系。
[0030]进一步,所述步骤(3)的过程为:
[0031]步骤3.1:图长短期记忆GraphLSTM是依托相关算法构建发酵过程出口浓度预测模型;图长短期记忆GraphLSTM主要基于图卷积网络(GCN)和长短期记忆(LSTM)构建;GCN是一种在非欧空间上对数据进行卷积的算法。GCN可以表示为:
[0032][0033]其中H为当前层特征向量,X
in
表示输入数据,W为权重矩阵,σ(.)为激活函数,表示输入的邻接矩阵,其中表示卷积核, D=∑
J
A
ij
表示邻接矩阵A的度矩阵。
[0034]对于序列建模而言,LSTM的主要创新是本质上充当状态信息的累加器C
t
。该单元由几个参数化的控制门访问、写入和清除。每当一个新数据输入时,如果输入门被激活,它的信息将被累积到单元中。此外,如果遗忘门F
t
开启,则过去的单元状态C
t
‑1可能会在此过程中被“遗忘”。最新的单元输出C
t
是否被传播到最终状态H
t
还由输出门 O
t
控制。LSTM主要等式如下所示,其中表示哈达玛乘积:
[0035][0036]I
t
表示输入门的结果,F
t
表示忘记门的结果,C
t
表示内存单元在当前时刻的结果,O
t
表示输出门的结果,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于时序图网络的发酵过程软测量建模方法,其特征在于,所述方法包括以下步骤:1)数据的获取和整合:使用仿真平台InPenSim获取不同工况下的青霉素发酵过程,并且以一小时为一批次对数据进行划分、收集和整合;2)数据选择:根据格兰杰因果检测GC Test对数据进行选择,去除冗余无用的数据并建立变量之间因果图;3)建模训练:构建基于时序图网络的发酵过程软测量建模方法的图长短期记忆GraphLSTM算法模型,模型的输入为经过选择保留的数据与变量之间的因果连接矩阵;然后利用图长短期记忆GraphLSTM模型对所整合的数据进行学习训练;4)模型预测:将训练后的图长短期记忆GraphLSTM模型用于青霉素发酵过程产物出口浓度预测,并给出预测结果。2.如权利要求1所述的一种基于时序图网络的发酵过程软测量建模方法,其特征在于,所述步骤1)的过程为:步骤1.1)设定InPenSim仿真过程,获得仿真平台变量的输出数据;步骤1.2)将输出数据划分成训练集、验证集和测试集;步骤1.3)由于不同特征变量之间数据差异性较大,需要对数据进行标准化处理,以便于模型进行处理和运算,具体公式如下所示:其中,X'是经标准化处理后的数据,X是未经标准化处理的原数据,μ是数据的均值,σ是数据的标准差。3.如权利要求2所述的一种基于时序图网络的发酵过程软测量建模方法,其特征在于,所述步骤2)的过程为:步骤2.1)使用格兰杰因果检测进行数据变量选择,首先建立两种不同的自回归模型来评估格兰杰因果关系:其中,a
1i,l
(i=1,2)和b
11,l
是自回归模型的系数,1≤1≤p;ε
1(t)
和ε
1(2)(t)
分别是完整模型和简化模型的预测误差;p是自回归模型的顺序,即模型所涉及的时间滞后;J是过...

【专利技术属性】
技术研发人员:刘毅贾明伟冯远静冯宇
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1