基于样本协同表示的即时学习的软测量建模方法技术

技术编号:32481997 阅读:14 留言:0更新日期:2022-03-02 09:46
本发明专利技术涉及一种基于样本协同表示的即时学习的软测量建模方法,该方法通过协同表示算法获得历史样本的权重矩阵,并通过加权岭回归算法建立加权岭回归模型,将两种算法进行融合,形成统一的优化目标。对于采集的查询数据,首先计算查询数据与训练样本的加权欧式距离,并将加权欧式距离融合到协同表示的正则项中,计算协同表示系数及各历史样本的权重矩阵,然后根据各样本的权重矩阵建立加权岭回归模型计算查询数据对应的输出值。本发明专利技术不仅能够很好地处理工业过程的非线性、时变性及多重共线性问题,还将相似样本选择和局部模型的构建融合到一个优化函数中,实现利用局部模型的信息指导相似样本的选择,提高相似样本的可靠性及局部模型的预测精度。局部模型的预测精度。局部模型的预测精度。

【技术实现步骤摘要】
基于样本协同表示的即时学习的软测量建模方法


[0001]本专利技术属于工业过程检测
,涉及工业过程软测量技术,具体地说,涉及了一种基于样本协同表示的即时学习的软测量建模方法。

技术介绍

[0002]在现代工业生产过程中,许多重要质量变量(例如:油品黏度、组分等)难以实时测量,给化工过程控制与优化带来很大影响。因为化工生产过程存在样品现场取样困难、分析仪器成本高以及分析时间滞后等问题,在实际生产过程中,往往难以使用在线分析仪表和离线化验等方式对质量变量进行实时测量,无法对质量变量形成闭环控制。因此,质量变量如何实时获取成为过程控制首先要解决的问题。由此,软测量进入了过程工业控制领域的研究视线。
[0003]常用的数据驱动软测量建模方法包括主元回归(Principal Component Regression,简称:PCR)、偏最小二乘回归(Partial Least Square Regression,简称:PLSR)以及人工神经网络(简称:ANN)。上述软测量算法建立的模型属于离线模型,模型建立后不会随着生成过程的改变而自适应调整,无法跟踪生产状态的变化,从而导致预测精度逐渐下降。因此,软测量模型的自动维护成为了算法研究与改进的重点。因此,为了适应现代化工生产过程表现出的多模态特性和时变特性,各种在线建模算法已经被广泛应用于生产过程的监控与质量变量预测。
[0004]目前,主流的在线软测量建模算法包括:滑动窗算法、递归算法、时间差分算法以及即时学习算法。其中,前三种都是根据时间相关性更新模型,属于时间自适应算法;即时学习算法是基于空间相关性对模型进行更新和维护,属于空间自适应算法。相比其他算法,即时学习算法的优势在于可以更好的适应生产过程中的突变现象,并且由于该算法对每个样本都建立局部模型,因此,也可以很好的描述过程变量之间的非线性关系。
[0005]相似样本的选择或者样本权重的计算是即时学习算法的核心步骤,会在很大程度上影响算法的预测精度。对于传统即时学习算法,一方面,相似样本的选择仅仅考虑了查询样本与历史样本输入变量的相似度,并没有考虑输出变量之间的相关性;另一方面,算法中一些可调参数的选择往往是一件非常困难的事,例如LWPLS算法中的核宽度参数以及LWLS算法中的相似样本的数目,这些参数的选择并没有明确的理论经验指导,并且会对模型的性能产生较大影响。由上可知,采用传统即时学习算法建立的模型存在预测精度差的问题。

技术实现思路

[0006]本专利技术针对现有技术存在的预测精度差等上述问题,提供一种基于样本协同表示的即时学习的软测量建模方法,能够提高样本权重的合理性与可靠性,无需选择相似样本个数以及高斯核函数的宽度等参数,提高了模型优化效率与预测精度。
[0007]为了达到上述目的,本专利技术提供了一种基于样本协同表示的即时学习的软测量建模方法,其具体步骤为:
[0008]S1、实时采集与存储工业过程中与质量相关的辅助变量的数据X=[x1,x2,

x
n
]T
,n为样本数量,m为样本的维度;通过实验室化验分析采集的数据,得到各个样本对应的真实质量变量值
[0009]S2、将已采集到的数据作为初始训练数据集对初始训练数据集按照公式(1)进行标准化处理,使其均值为0、方差为1,得到训练数据集X
L
为数据X标准化处理后得到的数据,为经标准化处理后得到的变量值,公式(1)表示为:
[0010][0011]式中,函数mean(
·
)表示计算矩阵各行的均值,函数std(
·
)表示计算矩阵各行的标准差;
[0012]S3、利用训练数据集建立离线岭回归模型,并且通过模型的回归系数计算得到各输入变量的权重矩阵
[0013]S4、对于新采集的查询数据按照公式(1)进行标准化处理;
[0014]S5、根据权重矩阵W
var
计算查询数据x
q
与数据X
L
中所有样本的加权欧式距离;将加权欧式距离融合到协同表示的正则项中;计算数据X
L
与查询数据x
q
的协同表示系数,利用该协同表示系数得出训练数据集中各历史样本的权重矩阵
[0015]S6、根据训练数据集以及各样本的权重矩阵W
sample
,建立加权岭回归模型,利用加权岭回归模型计算查询数据x
q
的输出值
[0016]S7、当查询数据x
q
所对应的真实输出值y
q
可以由实验室化验分析得到时,将样本[x
q
,y
q
]加入到训练数据集中,以扩充训练数据集中所包含的工作区间;否则,维持训练数据集中所包含空间不变。
[0017]优选的,步骤S3中,利用训练数据集建立离线岭回归模型,并且通过模型的回归系数计算得到各输入变量的权重的具体步骤为:
[0018]利用训练数据集建立离线岭回归模型,优化目标为:
[0019][0020]式中,为离线岭回归模型的岭回归系数,λ0为离线岭回归模型的正则项系数;
[0021]求解优化目标,得出离线岭回归模型的岭回归系数W0的解析表达式为:
[0022]W0=(X
L
X
LT
+λ0×
I)
‑1X
L
Y
L
ꢀꢀꢀ
(3)
[0023]式中,X
LT
为数据X
L
的转置,I为单位矩阵;
[0024]根据离线岭回归模型的岭回归系数W0通过公式(4)计算出各输入变量的权重矩阵,公式(4)表示为:
[0025][0026]式中,W0(1)为岭回归系数W0的第一个元素,W0(m)为岭回归系数W0的第m个元素。
[0027]优选的,步骤S5中,得出训练数据集中各历史样本的权重矩阵的具体步骤为:
[0028]根据权重矩阵W
var
通过公式(5)和公式(6)计算查询数据x
q
与数据X
L
中所有样本的加权欧式距离d;公式(5)和公式(6)的表达式为:
[0029]Dx
q
=W
var
(x
q
×1‑
X
L
)
ꢀꢀꢀ
(5)
[0030][0031]式中,为对角矩阵D
i,i
=d
i
,i=1,2,

,n,且元素全为1,符号表示两个矩阵的对应元素相乘,函数sum(.)表示将矩阵各行相加;
[0032]建立查询数据x
q
与训练数据集的协同表示模型,并融合权重矩阵和加权欧式距离,优化目标为:
[0033][0034]式中,为协同表示系数,λ1为正则项系数;
[0035本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于样本协同表示的即时学习的软测量建模方法,其特征在于,其具体步骤为:S1、实时采集与存储工业过程中与质量相关的辅助变量的数据X=[x1,x2,

x
n
]
T
,n为样本数量,m为样本的维度;通过实验室化验分析获得的数据,得到各个样本对应的真实质量变量值S2、将已采集到的数据作为初始训练数据集对初始训练数据集按照公式(1)进行标准化处理,使其均值为0、方差为1,得到训练数据集X
L
为数据X标准化处理后得到的数据,为经过标准化处理后得到的变量值,公式(1)表示为:式中,函数mean(
·
)表示计算矩阵各行的均值,函数std(
·
)表示计算矩阵各行的标准差;S3、利用训练数据集建立离线岭回归模型,并且通过模型的回归系数计算得到各输入变量的权重矩阵S4、对于新采集的查询数据按照公式(1)进行标准化处理;S5、根据权重矩阵W
var
计算查询数据x
q
与数据X
L
中所有样本的加权欧式距离;将加权欧式距离融合到协同表示的正则项中;计算数据X
L
与查询数据x
q
的协同表示系数,利用该协同表示系数得出训练数据集中各历史样本的权重矩阵S6、根据训练数据集以及各样本的权重矩阵W
sample
,建立加权岭回归模型,利用加权岭回归模型计算查询数据x
q
的输出值S7、当查询数据x
q
所对应的真实输出值y
q
可以由实验室化验分析得到时,将样本[x
q
,y
q
]加入到训练数据集中,以扩充训练数据集中所包含的工作区间;否则,维持训练数据集中所包含空间不变。2.如权利要求1所述的基于样本协同表示的即时学习的软测量建模方法,其特征在于,步骤S3中,利用训练数据集建立离线岭回归模型,并且通过模型的回归系数计算得到各输入变量的权重的具体步骤为:利用训练数据集建立离线岭回归模型,优化目标为:式中,为离线岭回归模型的岭回归系数,λ0为离线岭回归模型的正则项系数;求解优化目标,得出离线岭回归模型的岭回归系数W0的解析表达式为:W0=(X
L
X
LT
+λ0×
I)
‑1X
L
Y
L
ꢀꢀꢀꢀꢀꢀ
(3)式中,X
LT
为...

【专利技术属性】
技术研发人员:王平白玮吴昂山尹贻超
申请(专利权)人:中国石油大学华东
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1