当前位置: 首页 > 专利查询>江南大学专利>正文

基于TD-LightGBM的铁水硅含量预测方法技术

技术编号:35003305 阅读:19 留言:0更新日期:2022-09-21 14:53
本发明专利技术公开了基于TD

【技术实现步骤摘要】
基于TD

LightGBM的铁水硅含量预测方法


[0001]本专利技术涉及基于TD

LightGBM的铁水硅含量预测方法,属于工业过程监控


技术介绍

[0002]高炉炼铁是世界上耗能最大的工业过程之一,其主要目的是将铁矿融化成铁水。高炉炼铁过程的关键参数之一是铁水中的硅含量,铁水硅含量是评定高炉炉况稳定性和生铁质量的重要指标。因此,准确预报铁水硅含量有助于控制高炉热状态,进而保证高炉的稳定运行。由于炉内高温高压的环境,使得硅含量的测量变得十分困难。
[0003]近年来,随着工业过程的数据信息爆炸式增长,基于数据的软测量模型越来越多地应用于预测因为恶劣的测量环境和大时间滞后等原因导致难以在线测量的质量变量。目前,数据驱动建模主要可以分为人工智能方法和多元统计分析方法。其中人工智能软测量方法是目前的研究热点,建模方法主要包含人工神经网络、支持向量机等。此类模型具有较强的非线性拟合能力,但由于计算较为复杂且缺乏可靠性依据,在实际工业软测量中应用仍然较少。多元统计分析是使用较为成熟的方法,包含主元回归、偏最小二乘回归等。在实际工业过程中已得到广泛应用。
[0004]构建软测量模型来进行工业数据的预测不仅需要筛选输入变量和样本,还需要进行模型参数训练,这使得高性能软测量模型的构建非常耗时。而当高性能软测量模型投入应用后,其预测性能又会随着过程状态特性改变、催化剂失活、原料变化和仪表漂移等因素慢慢下降。因此,软测量模型的维护对于其性能的保持是非常重要的。学者们已经提出了许多模型更新策略,可以分为时间和空间自适应两种。时间自适应模型主要包括递归模型和滑动窗模型,这些方法将最新的样本数据用于模型更新。即时学习模型则利用与查询样本空间相关性最大的历史样本更新模型,因此隶属于空间自适应模型。
[0005]刘毅等人针对高炉炼铁数据中包含噪声和离群点,会降低软测量模型准确性的问题,提出一种结合2层变量空间分析的预处理方法,并利用支持向量回归建立软测量模型(刘毅,李平,高增梁.用于高炉铁水质量预报的改进支持向量回归[J].浙江大学学报(工学版),2012,46(05):830

836.)。郭东伟等人提出一种基于稀疏化鲁棒最小二乘支持向量机与多目标遗传参数优化的铁水动态软测量建模方法(郭东伟,周平.基于稀疏化鲁棒LS

SVR与多目标优化的铁水硅含量软测量建模[J].工程科学学报,2016,38(09):1233

1241.)。
[0006]上述方法虽然能够在一定程度上提高铁水硅含量预测的准确度,但是他们均未考虑到高炉炼铁过程中常常存在变量冗余和过程变量漂移的问题,且无法实时更新已建立模型,导致实际应用中铁水硅含量预测的准确率依然收到很大影响。

技术实现思路

[0007]为了解决目前的铁水硅含量预测方法忽略了仪表长期使用过程中存在变量漂移且无法实时更新导致预测准确率低的问题,本专利技术提供了一种铁水中硅含量的预测方法,
所述方法包括:
[0008]步骤1:采集炼铁高炉的历史实际运行数据,构建历史样本集和查询样本集;
[0009]步骤2:获取所述历史样本集的输入数据x(1),x(2),

,x(t+1),输出数据y(1),y(2),

,y(t+1),使用LightGBM建立决策树模型,得到特征向量,其中t是历史样本集采样时刻;
[0010]步骤3:对LightGBM决策树模型提取的特征向量按照各个特征的增益排序,选取前f个特征向量;
[0011]步骤4:计算步骤3得到的特征向量的差分项Δx(1),Δx(2),

,Δx(t)和Δy(1),Δy(2),

,Δy(t),以及查询样本输入的差分项Δx(q

1)=x(q)

x(q

1),q是查询样本集的采样时刻;
[0012]步骤5:计算步骤4中的查询样本差分项与各历史输入样本差分项之间的欧氏距离以及相应的权重值,选择与查询样本最相关的N个历史差分项作为训练集ΔX
N
和ΔY
N
,并获得权重矩阵Ω;
[0013]步骤6:构建局部加权岭回归LWRR模型,并利用步骤5中的训练集ΔX
N
、ΔY
N
和权重矩阵Ω训练所述局部加权岭回归LWRR模型;
[0014]步骤7:获取高炉运行的实时数据,利用步骤6中训练好的LWRR模型得到当前时刻与前一时刻铁水中硅含量的差分项预测值
[0015]步骤8:得到铁水中硅含量最终预测值其中y(q

1)为上一时刻的铁水中硅含量的实际值。
[0016]可选的,所述LightGBM决策树模型根据每个特征被用于分割训练数据的次数评判该特征的重要性,利用单边梯度采样算法对数据按照梯度进行排序,保留前a%梯度较大的数据形成子集A;对于(1

a)%梯度较小的数据形成的残差集A
c
,随机形成大小为b
·
|A
c
|的子集B,并计算信息增益:
[0017][0018]其中,A
l
={x(t)∈A:x
j
(t)≤d},A
r
={x(t)∈A:x
j
(t)>d},B
l
={x(t)∈B:x
j
(t)≤d},B
r
={x(t)∈B:x
j
(t)>d},g(t)为梯度,x(t)表示在t时刻的辅助变量的采样值,d是在分裂计算中找到的最佳增益不变的点,用于归一化B的梯度和到A
c
,是集合A
l
的样本数,x
j
(t)是第j个特征的t时刻的辅助变量。
[0019]可选的,所述局部加权岭回归LWRR模型包括:利用局部加权算法,根据查询样本与历史样本的欧氏距离对每个样本赋予不同的权值;利用岭回归算法,引入Tikhonov

Phillips正则项解决线性回归中存在的共线性问题。
[0020]可选的,所述局部加权岭回归LWRR模型对每个样本赋予的权值为:
[0021][0022]其中,为权重函数中的可调参数,为距离的标准差,d
i
为查询样本与第i个历史样本的距离;将各个样本的权重表示为权重向量w=[w1,w2,

,w
n
],并将权重矩阵记为Ω=diag(w)。
[0023]可选的,所述局部加权岭回归LWRR模型中查询样本的预测输出值的估计过程包括:
[0024]步骤71:去均值化,计算样本输入输出的加权平均值,并对训练样本的输入输出和查询样本的输入进行去均值化处理;
[0025]步骤72:将所述查询样本输出的初始估本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种铁水中硅含量的预测方法,其特征在于,所述方法包括:步骤1:采集炼铁高炉的历史实际运行数据,构建历史样本集和查询样本集;步骤2:获取所述历史样本集的输入数据x(1),x(2),

,x(t+1),输出数据y(1),y(2),

,y(t+1),使用LightGBM建立决策树模型,得到特征向量,其中t是历史样本集采样时刻;步骤3:对LightGBM决策树模型提取的特征向量按照各个特征的增益排序,选取前f个特征向量;步骤4:计算步骤3得到的特征向量的差分项Δx(1),Δx(2),

,Δx(t)和Δy(1),Δy(2),

,Δy(t),以及查询样本输入的差分项Δx(q

1)=x(q)

x(q

1),q是查询样本集的采样时刻;步骤5:计算步骤4中的查询样本差分项与各历史输入样本差分项之间的欧氏距离以及相应的权重值,选择与查询样本最相关的N个历史差分项作为训练集ΔX
N
和ΔY
N
,并获得权重矩阵Ω;步骤6:构建局部加权岭回归LWRR模型,并利用步骤5中的训练集ΔX
N
、ΔY
N
和权重矩阵Ω训练所述局部加权岭回归LWRR模型;步骤7:获取高炉运行的实时数据,利用步骤6中训练好的LWRR模型得到当前时刻与前一时刻铁水中硅含量的差分项预测值步骤8:得到铁水中硅含量最终预测值其中y(q

1)为上一时刻的铁水中硅含量的实际值。2.根据权利要求1所述的方法,其特征在于,所述LightGBM决策树模型根据每个特征被用于分割训练数据的次数评判该特征的重要性,利用单边梯度采样算法对数据按照梯度进行排序,保留前a%梯度较大的数据形成子集A;对于(1

a)%梯度较小的数据形成的残差集A
c
,随机形成大小为b
·
|A
c
|的子集B,并计算信息增益:其中,A
l
={x(t)∈A:x
j
(t)≤d},A
r
={x(t)∈A:x
j
(t)>d},B
l
={x(t)∈B:x
j
(t)≤d},B
r
={x(t)∈B:x
j
(t)>d},g(t)为梯度,x...

【专利技术属性】
技术研发人员:熊伟丽王佳宇
申请(专利权)人:江南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1