当前位置: 首页 > 专利查询>浙江大学专利>正文

基于贝叶斯集成学习的软测量建模方法技术

技术编号:15725226 阅读:87 留言:0更新日期:2017-06-29 13:13
本发明专利技术公开了一种基于贝叶斯集成学习的软测量建模方法,在模型集群分析算法的框架下,首先进行离线建模,采用适用于不同工业过程特性的多个软测量算法作为子算法,用贝叶斯集成学习方法计算出各个软测量子算法模型分配的权重。在线预测时,经过软测量子算法模型预测后,根据之前计算出的权重,通过贝叶斯集成求得待预测过程数据的最终预测结果分布范围。相比目前的其他方法,本发明专利技术提高了软测量模型对不同工业过程特性的适应性和预测精确度,并采用了模型集群分析来进行模型评价,从统计学的角度来评价模型的好坏,由此可以看到不同算法的整体预测效果,得到更多的信息。

【技术实现步骤摘要】
基于贝叶斯集成学习的软测量建模方法
本专利技术属于工业过程控制领域,尤其涉及一种基于贝叶斯集成学习的软测量建模方法。
技术介绍
生产装置的经济效益和产品品质,在当代工业的环境下被越来越严格地要求,这往往决定企业是否能在竞争日益激烈的市场环境下存活。在化工、发酵、生物、冶金、石油、食品等过程工业中,若要实现卡边控制、使生产装置运行于最佳的工作状况、生产更多的优质产品,就需要严格控制许多重要的过程变量。然而,往往很难用在线传感器直接把这些重要的过程变量测出来。有不少方法可以解决这样的测量问题,软测量是目前应用比较普遍的方法。集成学习是使用一系列学习器进行学习,并使用某种规则把各个学习结果进行整合从而获得比单个学习器更好的学习效果的一种机器学习方法。通常来说,在工业过程中,若能够找到或者设计一个足够好的软测量算法,使得该算法在各种环境下都具有很好的泛化误差,那就没有必要使用集成的思想。然而,实际应用中由于噪声、离群点或者不相关变量的存在,构造一个完美的软测量算法不可能实现,至少使它能适应不同的设计条件很难实现。虽然很多学者在单一软测量算法上做了许多改进,不过大部分都基于一定的假设条件,包括数据特征是线性相关的、服从高斯分布、工况平稳等等,但是实际的过程一般都是各种特征的综合体,使用假设条件会有局限性。因此本专利技术尝试构造一个包含若干软测量算法的集成学习系统,即选择多种软测量算法对工业过程进行检测,在统一的融合框架下,对各软测量算法的预测结果进行集成,以适应不同的过程特性。为了提高整个系统的多样性,选择可以处理线性、非线性、非高斯等不同工业过程的软测量算法,使得算法在应对具有该类特点的数据时,能获得较好的泛化性能,为后续的集成学习提供强的多样性。并采用模型集群分析方法,通过产生大数量训练集群,消除训练集的选择对于模型评价结果的影响,提高数据的多样性。与以往的从一个单一的输出值上进行模型评价的方法不同,模型集群分析方法的输出是一个分布,从而可以从统计学的角度得到更多的结论。
技术实现思路
本专利技术的目的在于针对现有方法的假设局限,提供一种基于贝叶斯集成学习的软测量建模方法。本专利技术的目的是通过以下技术方案来实现的:一种基于贝叶斯集成学习的软测量建模方法,其特征在于,包括以下步骤:(1)向系统输入n(n为大于0的自然数)个工业过程数据样本,对所有样本进行归一化处理,使得各个变量的均值为0,方差为1。将这些数据存入历史数据库。基于模型集群分析算法的框架进行接下来的步骤(2)至(4)。(2)采用蒙特卡洛算法从原始数据集中抽取a%(50≤a≤80)的样本作为训练样本,剩下的作为测试样本。蒙特卡洛重复N(N为大于0的自然数)次,共生成N个训练集和N个测试集。将这些数据存入历史数据库。(3)选择适用于不同工业过程特性的m个软测量算法作为集成学习的子算法。从数据库中调用N个训练集,并用软测量子模型算法对这些训练集分别建立N个子模型,然后调用数据库中对应的N个测试集进行预测。设每个子模型得到的预测结果为:yi,j(t),i=1,2,…,m,j=1,2,…,N,t=1,2,…,n×(1-a%)设测试集的真实结果为:Yi(t),i=1,2,…,N,t=1,2,…,n×(1-a%)通过下式求得各个子模型算法各自的N个均方根误差RMSEPi,j:将建模数据和各个软测量子模型算法参数存入历史数据库中备用。(4)从数据库中调用建模数据,采用贝叶斯集成算法对m个软测量子模型算法进行集成,得到各个子算法分配的权重,存入历史数据库中备用,具体步骤如下:a)通过下式求得贝叶斯集成算法的系数Zi:设Mi代表第i个子算法模型,贝叶斯先验概率被设为:设S代表测试数据集,贝叶斯似然概率为:贝叶斯后验概率为:b)最后再对每一个子模型的预测值进行加权求和,得到最终的预测值:离线建模完成。计算出贝叶斯集成模型的N个均方根误差,进行统计分析,评价模型优劣。(5)将在线过程数据输入系统,经过m×N个软测量算法模型预测后,根据之前得到的权重,通过贝叶斯集成求得待预测过程数据的最终预测结果分布范围。本专利技术的有益效果是:本专利技术针对单个软测量算法在一些条件下能有很好的性能而在另一些条件下就有可能表现不佳的局限性,提出了基于贝叶斯集成学习的软测量建模方法。相比目前的其他软测量方法,本专利技术不仅提高了软测量模型对不同工业过程特性的适应性,提高了过程变量预测精确度,而且采用了模型集群分析来进行模型评价,从统计学的角度来评价模型的好坏,由此可以看到不同算法的整体预测效果,得到更多的信息。附图说明图1为基于贝叶斯集成学习的软测量建模方法的流程图;图2为各个软测量子模型算法与贝叶斯集成算法的均方根误差分布比较的统计图,其中,(a)为PCR算法与贝叶斯集成算法的均方根误差分布比较的统计图,(b)为PLS算法与贝叶斯集成算法的均方根误差分布比较的统计图,(c)为ICR算法与贝叶斯集成算法的均方根误差分布比较的统计图,(d)为KPLS算法与贝叶斯集成算法的均方根误差分布比较的统计图,(e)为BP算法与贝叶斯集成算法的均方根误差分布比较的统计图;图3为贝叶斯集成算法与各个软测量子模型算法的均方根误差差值分布的统计图,其中,(a)为贝叶斯集成算法与PCR算法的均方根误差差值分布的统计图,(b)为贝叶斯集成算法与PLS算法的均方根误差差值分布的统计图,(c)为贝叶斯集成算法与ICR算法的均方根误差差值分布的统计图,(d)为贝叶斯集成算法与KPLS算法的均方根误差差值分布的统计图,(e)为贝叶斯集成算法与BP算法的均方根误差差值分布的统计图。具体实施方式本专利技术为了克服单个软测量算法的局限性,在模型集群分析算法的框架下,首先进行离线建模,采用蒙特卡洛算法对原始数据随机采样,生成N个训练集和N个测试集。采用适用于不同工业过程特性的多个软测量算法作为子算法,然后用贝叶斯集成学习方法计算出各个软测量子算法模型分配的权重。在线预测时,经过软测量子算法模型预测后,根据之前计算出的权重,通过贝叶斯集成求得待预测过程数据的最终预测结果分布范围。以下结合一个具体的工业过程的例子来说明本专利技术的有效性。在合成氨工艺过程中,甲烷脱碳单元会产生氢气,碳元素却仍以CO与CO2的形式存在。高-低温度转换单元的作用就是把CO转换成CO2,而CO2能够被CO2吸收塔吸收,并在尿素合成单元作为原料重新利用。CO变换是先后在过程中按如下反应式进行:变换后气体仅含CO0.29%(干基体积)。变换反应增加了H2,同时产生与CO等量的CO2。该反应在催化剂存在时进行,低温和高蒸汽浓度有利于平衡,而高温有利于反应速度,但高蒸汽浓度将使反应速度明显降低,因大气量会导致缩短(与触媒的)接触时间。高-低温度转换单元共27个变量,如表1所示,其中包括26个常规过程变量和1个质量变量,出口CO含量。参考图1,根据基于贝叶斯集成学习的软测量建模方法的流程图,本专利技术采用的技术方案的主要步骤分别如下:第一步向系统输入n(n=3000)个工业过程数据样本,对所有样本进行归一化处理,使得各个变量的均值为0,方差为1。将这些数据存入历史数据库。基于模型集群分析算法的框架进行接下来的步骤二至步骤四。模型集群分析方法的步骤是:a)用蒙特卡洛方法从原始数据集中随机生成N(本文档来自技高网
...
基于贝叶斯集成学习的软测量建模方法

【技术保护点】
一种基于贝叶斯集成学习的软测量建模方法,其特征在于,包括以下步骤:(1)向系统输入n(n为大于0的自然数)个工业过程数据样本,对所有样本进行归一化处理,使得各个变量的均值为0,方差为1。将这些数据存入历史数据库。基于模型集群分析算法的框架进行接下来的步骤2‑4。(2)采用蒙特卡洛算法从原始数据集中抽取a%(50≤a≤80)的样本作为训练样本,剩下的作为测试样本。蒙特卡洛重复N(N为大于0的自然数)次,共生成N个训练集和N个测试集。将这些数据存入历史数据库。(3)选择适用于不同工业过程特性的m(m为3≤m≤8的自然数)个软测量算法作为集成学习的子算法。从数据库中调用N个训练集,并用软测量子模型算法对这些训练集分别建立N个子模型,然后调用数据库中对应的N个测试集进行预测。设每个子模型得到的预测结果为:y

【技术特征摘要】
1.一种基于贝叶斯集成学习的软测量建模方法,其特征在于,包括以下步骤:(1)向系统输入n(n为大于0的自然数)个工业过程数据样本,对所有样本进行归一化处理,使得各个变量的均值为0,方差为1。将这些数据存入历史数据库。基于模型集群分析算法的框架进行接下来的步骤2-4。(2)采用蒙特卡洛算法从原始数据集中抽取a%(50≤a≤80)的样本作为训练样本,剩下的作为测试样本。蒙特卡洛重复N(N为大于0的自然数)次,共生成N个训练集和N个测试集。将这些数据存入历史数据库。(3)选择适用于不同工业过程特性的m(m为3≤m≤8的自然数)个软测量算法作为集成学习的子算法。从数据库中调用N个训练集,并用软测量子模型算法对这些训练集分别建立N个子模型,然后调用数据库中对应的N个测试集进行预测。设每个子模型得到的预测结果为:yi,j(t),i=1,2,…,m,j=1,2,…,N,t=1,2,…,n×(1-a%)设测试集的真实结果为:Yi(t),i=1,2,…,N,t=1,2,…,n×(1-a%)通过下式求得各个子模型算法各自的N个均方根误差RMSEPi,j:将建模数据和各个软测量子模型算法参数存入历史数据库中备用。(4)从数据库中调用建模数据,采用贝叶斯集成算法对m个软测量子模型算法进行集成,得到各个子算法分配的权重,存入历史数据库中备用。离线建模完成。(5)将在线过程数据输入系统,经过m×N个软测量算法模型预测后,根据之前得到的权重,通过贝叶斯集成求得待预测过程数据的最终预测结果分布范围。2.根据权利要求1所述基于...

【专利技术属性】
技术研发人员:葛志强陆建丽
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1