基于数据流在线聚类分析的工业过程软测量建模方法、系统技术方案

技术编号:34829046 阅读:61 留言:0更新日期:2022-09-08 07:20
本发明专利技术公开了一种基于数据流在线聚类分析的工业过程软测量建模方法、系统,本发明专利技术借鉴了局部学习思想,通过在线聚类分析对过程状态进行动态识别,并为其在线构建局部化高斯过程回归软测量模型。首先将到达的部分初始流数据进行了在线聚类,形成部分初始微簇,使得同一类之间的数据特征相似度尽可能高,不同类之间的数据特征相似度尽可能低,最大程度地利用了数据的空间分布特征;然后对新到达的样本进行聚类,对聚类成功的样本使用对应类的所有历史样本点建立GPR训练模型,对在线测试样本点进行预测,对聚类不成功的样本点利用即时学习思想从历史样本点中挑选与在线测试样本点最相似的部分样本点建立GPR训练模型,对在线测试样本点进行预测。试样本点进行预测。试样本点进行预测。

【技术实现步骤摘要】
基于数据流在线聚类分析的工业过程软测量建模方法、系统


[0001]本专利技术涉及一种基于数据流在线聚类分析的工业过程软测量建模方法、系统,属于过程控制领域。

技术介绍

[0002]在化工生产过程中存在一些与产品质量密切相关的过程变量难以实时测量,大多采用软测量技术进行离线建模分析实现关键过程变量的估计。然而,传统的离线建模所需的训练成本较高,往往是批处理模式,对于新的训练数据,模型往往要从头开始重新训练,造成了传统的批量学习方法时间和空间成本效率低的问题,对大规模应用的可扩展性差。
[0003]软测量技术的核心是通过某种最优准则,构建辅助变量(易测变量)与主导变量(难测变量)之间的函数关系式,并通过计算机软件,实现主导变量的在线估计。软测量建模方法的全局建模试图建立一个在所有过程状态上都能发挥良好性能的单一预测模型,然而由于工业过程中的强非线性、多模式、多时段以及时变性的特点,全局模型并不总是能发挥良好的作用。

技术实现思路

[0004]本专利技术提供了一种基于数据流在线聚类分析的工业过程软测量建模方法、系统,以用于对以流的形式到达的数据利用在线聚类的方法进行过程状态识别,并进一步实现测试样本点的主导变量的预测,再进一步通过本专利技术的软测量建模方法用于金霉素基质浓度的预测方法。
[0005]本专利技术的技术方案是:一种基于数据流在线聚类分析的工业过程软测量建模方法,包括:
[0006]划分步骤,收集实时工业过程标记数据形成样本集,将样本集划分为初始训练集XY
trn<br/>以及测试集X
test

[0007]获得步骤,对以流的形式依次到达的初始训练集XY
trn
中的n维辅助变量构建的每个样本点使用在线聚类方法进行聚类,获得m个初始微簇;
[0008]预测步骤,在初始微簇的基础上,对以流的形式依次到达的在线测试样本点x
new
采用在线聚类方法进行聚类,并根据聚类结果的不同采用不同的训练模型进行预测。
[0009]所述初始训练集XY
trn
和测试集X
test
中的每个样本均包括真实主导变量和n维辅助变量。
[0010]所述在线聚类方法,包括:
[0011]S2.1、设置聚类参数;其中,聚类参数包括:聚类半径R和最小密度阈值M;
[0012]S2.2、对于每一个到达的样本点X,进行聚类,聚类分为三种情况:归类、新类、离群值。
[0013]所述聚类分类过程如下:
[0014]如果历史样本点形成了已有聚类,则计算样本点X与已有聚类的每一个聚类中心
之间的欧氏距离:如果存在一个聚类中心与X的欧氏距离小于等于聚类半径R,则将样本点X归类至符合判断条件的聚类中心所代表的微簇;如果存在多个聚类中心与样本点X的欧氏距离小于等于聚类半径R,则将X归类至符合判断条件的所有聚类中心所代表的微簇,完成归类;否则,计算样本点X与所有历史离群值之间的欧氏距离:如果欧氏距离小于等于聚类半径R且达到最小密度阈值M,则将满足条件的历史离群值与样本点X形成一个新的微簇并计算微簇的聚类中心,完成新类动作,其它不符合判断条件的,则不做处理,仍为离群值;否则,将到达的样本点作为离群值;其中,聚类中心为微簇中所有样本点的平均值;
[0015]所述欧氏距离d:
[0016][0017]其中,x
i
表示样本点的第i维辅助变量,y
i
表示聚类中心/离群值的第i维辅助变量。
[0018]所述预测步骤,具体为:
[0019]在初始微簇的基础上,对逐个到达的在线测试样本点x
new
的中的n维辅助变量采用在线聚类方法进行聚类,如果聚类的结果为归类或者新类,则采用对应类中所有历史样本点的真实主导变量和n维辅助变量训练GPR模型,采用训练好的GPR模型,对在线测试样本点x
new
进行预测,获得预测主导变量;如果聚类的结果为离群值,则采用基于即时学习思想,从带有真实主导变量的历史样本点中挑选与在线测试样本点x
new
最相似的部分样本点用于训练GPR模型,采用训练好的GPR模型,对在线测试样本点x
new
进行预测,获得预测主导变量;
[0020]所述在线测试样本点x
new
采用测试集X
test
构建;或者采用实时采集的工业过程非标记数据构建。
[0021]采用欧氏距离相似度、马氏距离相似度、协方差加权距离相似度、曼哈顿距离相似度或皮尔逊系数相似度作为相似度准则进行最相似的部分的选取。
[0022]一种基于数据流在线聚类分析的工业过程软测量建模系统,包括:
[0023]划分单元,用于收集实时工业过程标记数据形成样本集,将样本集划分为初始训练集XY
trn
以及测试集X
test

[0024]获得单元,用于对以流的形式依次到达的初始训练集XY
trn
中的n维辅助变量构建的每个样本点使用在线聚类方法进行聚类,获得m个初始微簇;
[0025]预测单元,用于在初始微簇的基础上,对以流的形式依次到达的在线测试样本点x
new
采用在线聚类方法进行聚类,并根据聚类结果的不同采用不同的训练模型进行预测。
[0026]一种金霉素基质浓度预测方法,采用上述中任一项所述的基于数据流在线聚类分析的工业过程软测量建模方法进行。
[0027]本专利技术的有益效果是:本专利技术针对过程工业重要变量难以在线实时预测以及预测精度不高的问题,借鉴了局部学习思想,通过在线聚类分析对过程状态进行动态识别,并为其在线构建局部化高斯过程回归(GPR)软测量模型。首先将到达的部分初始流数据进行了在线聚类,形成部分初始微簇,使得同一类之间的数据特征相似度尽可能高,不同类之间的数据特征相似度尽可能低,最大程度地利用了数据的空间分布特征;然后对新到达的样本进行聚类,对聚类成功的样本使用对应类的所有历史样本点建立GPR训练模型,对在线测试样本点进行预测,对聚类不成功(即离群值)的样本点利用即时学习思想从历史样本点中挑选与在线测试样本点最相似的部分样本点建立GPR训练模型,对在线测试样本点进行预测。
相比较其他的软测量建模方法,本专利技术在实时提供预测结果的同时有效的提高了在线预测的精度,在线聚类分析和建模过程较好的克服了工业过程中在线学习存在的非线性和时变性对预测精度的影响。
附图说明
[0028]图1为本专利技术方法的流程图;
[0029]图2为移动窗口高斯过程回归方法MWGPR和所提ODSCGPR方法的金霉素基质浓度第93批

第97批测试数据的局部预测值与预测误差对比图;
[0030]图3为移动窗口高斯过程回归方法MWGPR和所提ODSCGPR方法的金霉素基质浓度第104批

第107批测试数据的局部预测本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据流在线聚类分析的工业过程软测量建模方法,其特征在于:包括:划分步骤,收集实时工业过程标记数据形成样本集,将样本集划分为初始训练集XY
trn
以及测试集X
test
;获得步骤,对以流的形式依次到达的初始训练集XY
trn
中的n维辅助变量构建的每个样本点使用在线聚类方法进行聚类,获得m个初始微簇;预测步骤,在初始微簇的基础上,对以流的形式依次到达的在线测试样本点x
new
采用在线聚类方法进行聚类,并根据聚类结果的不同采用不同的训练模型进行预测。2.根据权利要求1所述的基于数据流在线聚类分析的工业过程软测量建模方法,其特征在于:所述初始训练集XY
trn
和测试集x
test
中的每个样本均包括真实主导变量和n维辅助变量。3.根据权利要求1所述的基于数据流在线聚类分析的工业过程软测量建模方法,其特征在于:所述在线聚类方法,包括:S2.1、设置聚类参数;其中,聚类参数包括:聚类半径R和最小密度阈值M;S2.2、对于每一个到达的样本点X,进行聚类,聚类分为三种情况:归类、新类、离群值。4.根据权利要求3所述的基于数据流在线聚类分析的工业过程软测量建模方法,其特征在于:所述聚类分类过程如下:如果历史样本点形成了已有聚类,则计算样本点X与已有聚类的每一个聚类中心之间的欧氏距离:如果存在一个聚类中心与X的欧氏距离小于等于聚类半径R,则将样本点X归类至符合判断条件的聚类中心所代表的微簇;如果存在多个聚类中心与样本点X的欧氏距离小于等于聚类半径R,则将X归类至符合判断条件的所有聚类中心所代表的微簇,完成归类;否则,计算样本点X与所有历史离群值之间的欧氏距离:如果欧氏距离小于等于聚类半径R且达到最小密度阈值M,则将满足条件的历史离群值与样本点X形成一个新的微簇并计算微簇的聚类中心,完成新类动作,其它不符合判断条件的,则不做处理,仍为离群值;否则,将到达的样本点作为离群值;其中,聚类中心为微簇中所有样本点的平均值。5.根据权利要求4所述的基于数据流在线聚类分析的工业过程软测量建模方法,其特征在于:所述欧氏距离d:其中,x
i
表示样本点的第i维辅助变量,y
i

【专利技术属性】
技术研发人员:金怀平王月晨杨彪刘海鹏张志坤
申请(专利权)人:昆明理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1