一种集成多工况分析的化工生产过程质量预测方法技术

技术编号:37156956 阅读:19 留言:0更新日期:2023-04-06 22:19
本发明专利技术属于工业生产过程过程变量检测领域,提供了一种集成多工况分析的化工生产过程质量预测方法。本发明专利技术方法的优点:1)所提方法创新性地提出用粒子群优化的ELM作为子模型来解决模型集成精度差的问题,不仅提高了由子模型集成的软测量模型的预测精度和速度,而且改善了子模型之间的差异性,能够实现模型之间更好地集成。2)为了提高集合模型的效率,本发明专利技术提出利用具有快速收敛性的遗传算法来选择子模型,并有选择地将PSOELM建立的模型进行整合,这样既保证了模型的适用性,又大大降低了存储空间和计算的复杂性。存储空间和计算的复杂性。存储空间和计算的复杂性。

【技术实现步骤摘要】
一种集成多工况分析的化工生产过程质量预测方法


[0001]本专利技术属于工业生产过程过程变量检测领域,具体涉及一种集成多工况分析的化工生产过程质量预测方法。

技术介绍

[0002]在化工生产过程中,需要对某些重要的过程变量和产品质量变量进行检测时,受限于技术或工艺条件而无法直接测量(如需要用到成分分析仪,时间成本大等),便利用到软测量技术。软测量建模就是选择一组与主导变量相关性较大的且容易测得的辅助变量,通过建立主导变量以及辅助变量的数学模型来对主导变量的值进行回归预测。
[0003]在软测量建模方法当中,极限学习机(Extreme Learning Machine,ELM)由于其结构简单、训练速度快、泛化性能好等优点,被广泛用于工业软测量建模当中。相比于传统的神经网络,极限学习机能够克服梯度下降的反复迭代过程,在保证学习精度的前提下比传统的学习算法速度更快。然而,由于ELM网络生成过程随机产生输入层权值和隐含层阈值,造成参数选取不当,从而导致网络学习性能不足,对样本的预测能力下降,不能满足实际的工业要求。
[0004]实际工业软测量建模过程中,由于现代化工过程工况较为复杂,会导致单一软测量模型无法保证全局范围内的预测度。而集成学习能够构建并结合多个学习器来完成学习任务,让部分相对较弱的模型通过某种策略结合起来,使得各子模型发挥出各自的优势,完成全局回归任务,因此被广泛运用于实际数据的回归预测中。传统集成学习将所建立的子模型全部进行集成后预测结果,虽然此种方法获得的集成学习机的预测效果显著优于单个基学习器,但存在以下明显缺陷:(1)与基学习器相比,集成后的模型预测速度明显下降。(2)随着基学习器数目的增加,所需要的存储空间也急剧增加。

技术实现思路

[0005]针对上述问题,本专利技术提出了一种利用遗传算法有选择地集成粒子群算法优化的极限学习机的新型集合软传感器方法,简称为GASEN

PSOELM。相较于现有传统的方法,所提出的新型集成软测量方法不仅能提高预测速度,而且还能保证良好的预测精度和泛化性能。
[0006]为实现上述目标,本专利技术的技术方案:
[0007]一种集成多工况分析的化工生产过程质量预测方法,步骤如下:
[0008](1)将数据集划分为训练集、验证集和测试集;
[0009]为了能够利用遗传算法有选择地集成粒子群算法优化的极限学习机的新型集合软测量方法解决多工况的化工生产过程进行质量预测问题,本专利技术构建了化工生产过程数据和生产装置数据的数据集。面向化工生产过程和化工生产装置分别选取33个过程变量和7个测量变量对生产产品的产品质量进行预测分析,并将数据集随机划分为训练集、验证集和测试集。
[0010](2)基于粒子群优化的极限学习机构建候选子模型;
[0011]训练集通过Bootstrap采样生成若干子训练集,针对生成的子训练集建立ELM模型,并通过粒子群优化得到各子训练集的最优权值和阈值,获得最优的ELM模型网络结构,得到候选子模型。
[0012]ELM模型的输出表示为:
[0013][0014]其中,x
i
指的是第i个输入变量,w
i
是输入层和隐含层的连接权值,b
i
为隐含层神经元阈值,g为激活函数。
[0015]输入层和隐含层的连接权值、隐含层的阈值随机设定,且设定后不用再调整;隐含层和输出层之间的连接权值β不需要迭代调整,而是通过解方程组方式一次性确定;神经元网络的输出可以表示为:
[0016]Hβ=T
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0017]反解得:β=H
+
T(3)
[0018]其中,H为隐含层的输出矩阵,H
+
为H的广义逆矩阵,T为已知的输出矩阵。
[0019]针对ELM模型设置参数的随机性,将连接权值和阈值随机设定,再不断迭代更新,寻找最优值;在每一次迭代中,粒子通过跟踪两个“极值”来进行更新。第一个就是粒子本身所找到的最优解,即个体极值P。另一个极值是整个种群目前找到的最优解,这个极值是全局极值G;在找到这两个“极值”后,粒子通过下面的公式来更新自己的速度和位置:
[0020][0021][0022]其中,v和x分别是粒子的速度和位置,W表示惯性系数,r1和r2表示在(0,1)内均匀分布的随机数,C1和C2是学习因子,通常默认设定C1=C2=2;表示在第t步迭代中第i个粒子第d维所找到的个体极值,表示在第t步迭代中第i个粒子第d维所找到的个体极值;
[0023](3)利用遗传算法基于验证集进行模型的选择;
[0024]针对训练集所建立的候选子模型,基于验证集来比较各个子训练集的子模型所表现的预测精度,选取使验证集预测精度最好的子模型用于测试集进行集成,具体实现如下:
[0025]对每个子学习器赋予初始权值,根据评测的标准,选择衡量预测精度的量作为遗传算法的适应度函数;基于验证集,利用遗传算法来优化目标函数得到最优权重向量,将其和所设定的阈值相比,保留大于阈值的子模型。
[0026]选择性集成过程表示为如下优化问题:
[0027][0028][0029]其中,E
rmse
表示选择性集成的均方根误差,k表示验证样本集的数量,y表示验证样本的真值,表示验证样本的估计值,n
mod
为选择的子模型的数量,N
mod
为模型的总数量,为代表模型重要程度的权值;l为对应的模型,即y
l
是模型的实际输出值,是对应模型的预测值;
[0030](4)选定子模型之后,利用简单平均集成求得所预测的结果;
[0031]对于集成学习在回归预测中的使用主要分为两步,即子模型的建立以及预测结果的集成,在子模型建立及选择完毕之后,将各个模型的预测结果进行集成,包括简单平均集成以及加权平均集成,在本方法中使用简单平均集成,即为了避免回归预测所产生的模型过拟合,子模型的权重只用于子模型网络的选择,而不用于最终结果的加权平均。
[0032]本专利技术的有益效果:1)所提方法创新性地提出用粒子群优化的ELM作为子模型来解决模型集成精度差的问题,不仅提高了由子模型集成的软测量模型的预测精度和速度,而且改善了子模型之间的差异性,能够实现模型之间更好地集成。2)为了提高集合模型的效率,本专利技术提出利用具有快速收敛性的遗传算法来选择子模型,并有选择地将PSOELM建立的模型进行整合,这样既保证了模型的适用性,又大大降低了存储空间和计算的复杂性。
附图说明
[0033]图1为本专利技术中算法流程示意图。
具体实施方式
[0034]下面结合附图和技术方案,进一步说明本专利技术的具体实施方式。
[0035]本部分以实际化工生产过程为应用对象,选取33个过程监测变量来预测某化工产品的质量,选取500组数据作为训练集,200组数据为验证集,200组数据为测试集进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种集成多工况分析的化工生产过程质量预测方法,其特征在于,步骤如下:(1)将数据集划分为训练集、验证集和测试集;构建化工生产过程数据和生产装置数据的数据集;面向化工生产过程和化工生产装置分别选取33个过程变量和7个测量变量对生产产品的产品质量进行预测分析,并将数据集随机划分为训练集、验证集和测试集;(2)基于粒子群优化的极限学习机构建候选子模型;训练集通过Bootstrap采样生成若干子训练集,针对生成的子训练集建立ELM模型,并通过粒子群优化得到各子训练集的最优权值和阈值,获得最优的ELM模型网络结构,得到候选子模型;ELM模型的输出表示为:其中,x
i
指的是第i个输入变量,w
i
是输入层和隐含层的连接权值,b
i
为隐含层神经元阈值,g为激活函数;输入层和隐含层的连接权值、隐含层的阈值随机设定,且设定后不用再调整;隐含层和输出层之间的连接权值β不需要迭代调整,而是通过解方程组方式一次性确定;神经元网络的输出表示为:Hβ=T
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)反解得:β=H
+
T(3)其中,H为隐含层的输出矩阵,H
+
为H的广义逆矩阵,T为已知的输出矩阵;针对ELM模型设置参数的随机性,将连接权值和阈值随机设定,再不断迭代更新,寻找最优值;在每一次迭代中,粒子通过跟踪两个“极值”来进行更新;第一个就是粒子本身所找到的最优解,即个体极值P;另一个极值是整个种群目前找到的最优解,这个极值是全局极值G;在...

【专利技术属性】
技术研发人员:朱理尹永强徐喜荣杨鑫魏小鹏丁山
申请(专利权)人:大连理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1