基于注意力机制的高炉热负荷异常状态监测方法技术

技术编号:32230378 阅读:48 留言:0更新日期:2022-02-09 17:35
一种基于注意力机制的高炉热负荷异常状态监测方法,首先进行数据采集与数据预处理,然后构建包括双层一维卷积神经网络结构与单层双向长短记忆网络下结构的基于注意力机制的预测模型,再基于联合训练机制的方式进行预测模型的训练,最后通过添加注意力机制的1DCNN提取输入参数显著异常波动的特征,再由BiLSTM在时间维度上的记忆功能,实现在线监测,本发明专利技术考虑所采集历史数据的质量问题设计两阶段数据预处理方法,能够显著提升热负荷急剧变化时趋势状态的预测准确性,把握高炉设备的运行状况,保证高炉炼铁生产过程的持续与稳定。定。定。

【技术实现步骤摘要】
基于注意力机制的高炉热负荷异常状态监测方法


[0001]本专利技术涉及的是一种高炉炼铁过程控制领域的状态监测技术,具体是一种基于注意力机制的高炉热负荷异常状态监测方法。

技术介绍

[0002]高炉热负荷是指单位时间通过单位面积冷却设备所带走的热量,是监测高炉设备状态的关键指标。热负荷控制不当,会带来许多不良的影响。在现有的理论研究工作中,对热负荷的计算与预测评估方法主要分为机理建模方法与数据驱动方法。传统高炉热负荷监测问题主要以机理分析与过程建模为主,而数据驱动方法主要以机器学习方法与各类神经网络方法进行预测建模为主。
[0003]然而,由于高炉炼铁过程的复杂多变,现有的分析方法并不能准确地预测热负荷,仍然面临如下挑战:
[0004]1)影响因素众多,历史数据质量差:在实际工况下高炉炼铁过程所采集的各项参数值,由于采集设备异常、周边环境温度过高等,造成部分采集的数据缺失、显著离群点以及量纲差异大等问题,对进一步的数据分析与建模造成困扰。
[0005]2)强耦合非线性关系复杂:由于高炉炼铁过程的作用机理复杂,所采集的历史数据中变量间的相关关系复杂,既有时间序列变量,也有非时间序列变量,导致多数据存在高维数和冗余,简单的回归分析方法无法建立输入参数与目标值之间的强非线性关系。
[0006]3)数据多粒度属性:所采集的状态监测数据的粗细粒度不同,有不同类型的粗粒度特征,如:温度、压力、和热负荷等,同时也存在细粒度特征,如:高炉设备不同部位所采集的温度等,现有的浅神经网络模型不能有效地提取这些特征。
[0007]4)时变与高动态性:高炉炼铁过程中发生激烈的氧化还原反应,导致炉内温度、压力、热负荷等参数指标的急剧变化,现有的热负荷状态监测方法与数据驱动的预测建模方法无法有效获取热负荷急剧变化的趋势。

技术实现思路

[0008]本专利技术针对现有高炉热负荷异常状态监测方法在时变高动态特性下的异常状态实时预测问题,提出一种基于注意力机制的高炉热负荷异常状态监测方法,考虑所采集历史数据的质量问题设计两阶段数据预处理方法,能够显著提升热负荷急剧变化时趋势状态的预测准确性,把握高炉设备的运行状况,保证高炉炼铁生产过程的持续与稳定。
[0009]本专利技术是通过以下技术方案实现的:
[0010]本专利技术涉及一种基于注意力机制的高炉热负荷异常状态监测方法,首先进行数据采集与数据预处理,然后构建包括双层一维卷积神经网络(1DCNN)结构与单层双向长短记忆网络(BiLSTM)结构的基于注意力机制的预测模型,再基于联合训练机制的方式进行预测模型的训练,最后通过添加注意力机制的1DCNN提取输入参数显著异常波动的特征,再由BiLSTM在时间维度上的记忆功能,实现在线监测。
[0011]所述的数据采集是指:通过传感器采集的高炉炼铁过程的历史数据集,建立高炉热负荷的预测模型。
[0012]所述的数据预处理是指:经过数据清洗和基于互信息的特征选择的两阶段数据预处理和数据集划分,得到便于后续预测建模与统计分析的标准化关键输入参数,具体为:在第一阶段中依次采用缺失值填充、箱型图异常点剔除以及最大最小归一化方法实现原始数据的标准化,在第二阶段中采用连续随机变量互信息求取方法,分别计算每个输入变量与热负荷之间的互信息值,并设置参数过滤阈值,当所计算的互信息值大于所设置的参数过滤阈值,则进一步将参数依据从大到小的顺序排列;否则认为该参数与热负荷之间的非线性关联关系不足,进而默认该参数与热负荷无关,并将该部分参数进行剔除。
[0013]所述的数据清洗过程中对实际采集的数据进行缺失值、异常值以及量纲不一致问题处理;由于采集设备异常、周边环境温度过高等,造成部分采集的数据缺失,考虑到所采集的是与热负荷相关的时序数据,因而该部分数据不可直接剔除,采用上一时刻数据填充法对缺失的数据进行填充;箱型图法由于不受数据分布的限制,能直观表现数据分布的本来面貌,具有较强的鲁棒性特点,故对所采集的参数中存在的异常点利用箱型图法进行筛选剔除,并采用上一时刻值对所剔除的点进行填充;考虑到高炉炼铁温度、料速、煤比等各项参数指标之间的量纲差异大,因此对所采集的参数值利用最大

最小值归一化方法进行标准化处理。
[0014]所述的互信息是描述两个随机变量之间相互依存关系强弱的信息度量方法,对于高炉炼铁过程的相关参数与高炉热负荷变量。
[0015]所述的连续随机变量互信息求取方法,分别对各项参数与热负荷值进行关联分析,具体为:其中:p(x
i
,y)为当前参数X
i
与热负荷值Y的联合概率密度函数,而p(x
i
)和p(y)分别为当前参数X
i
和热负荷值Y的边缘概率密度函数。通过互信息得到每个参数与热负荷值之间的互信息值,之后依据互信息值进行倒序排列,挑选出与目标值关联性较强的特征参数。
[0016]所述的基于互信息的特征选择,通过算法实现无关参数的自动过滤与特征维度缩减:所采集的高炉炼铁数据中包含温度、料速、煤比、焦比等诸多量化参数,参数之间存在线性相关关系,表现出一定的参数冗余,无法准确判断其中对高炉热负荷具有直接关联影响的参数;当将所有参数同时作为输入变量,则有可能因为参数之间的冗余,增加预测模型对输入参数的敏感性,降低模型的鲁棒性;因此,通过设计特征选择方法从诸多变量中挑选出与目标值直接关联的低冗余特征,并以此作为输入,实现基于关键影响因素作为输入的预测建模。
[0017]通过两阶段数据预处理过程得到与热负荷密切关联的相关参数,而无关的、冗余的参数在此过程中被过滤。
[0018]所述的数据集划分是指:将数据清洗与特征选择后的数据划分为用于对后续预测模型进行训练的训练集和用于对模型的预测准确性、误差等指标进行测试验证的测试集。
[0019]所述的双层一维卷积神经网络结构,具体包括:输入层、卷积层、池化层、全连接层和输出层,其中:CNN通过逐层的卷积和池化操作提取数据特征,经过多个滤波器操作之后,最终将这些高维数据特征转化为低维数据特征,并输入全连接层进行进一步的回归或分类
分析。
[0020]在一维卷积层中,输入的数据信息在流向下一层之前需要经过卷积操作和激活函数的计算,具体为:h
t
=σ
cnn
(W
cnn
*x
t
+b
cnn
),其中:W
cnn
为滤波器的权重系数,即卷积核;x
t
为第t个输入样本数据信息;*为x
t
与W
cnn
之间的离散卷积运算;b
cnn
为偏置参数,该参数主要通过对模型进行训练时学习获得;σ
cnn
(
·
)为激活函数;h
t
为卷积操作结束后的输出数据。
[0021]所述的一维卷积神经网络中,卷积操作在层与层之间建立映射关系,为进一步减小计本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制的高炉热负荷异常状态监测方法,其特征在于,首先进行数据采集与数据预处理,然后构建包括双层一维卷积神经网络结构与单层双向长短记忆网络结构的基于注意力机制的预测模型,再基于联合训练机制的方式进行预测模型的训练,最后通过添加注意力机制的1DCNN提取输入参数显著异常波动的特征,再由BiLSTM在时间维度上的记忆功能,实现在线监测;所述的数据采集是指:通过传感器采集的高炉炼铁过程的历史数据集,建立高炉热负荷的预测模型。2.根据权利要求1所述的基于注意力机制的高炉热负荷异常状态监测方法,其特征是,所述的数据预处理是指:经过数据清洗和基于互信息的特征选择的两阶段数据预处理和数据集划分,得到便于后续预测建模与统计分析的标准化关键输入参数,具体为:在第一阶段中依次采用缺失值填充、箱型图异常点剔除以及最大最小归一化方法实现原始数据的标准化,在第二阶段中采用连续随机变量互信息求取方法,分别计算每个输入变量与热负荷之间的互信息值,并设置参数过滤阈值,当所计算的互信息值大于所设置的参数过滤阈值,则进一步将参数依据从大到小的顺序排列;否则认为该参数与热负荷之间的非线性关联关系不足,进而默认该参数与热负荷无关,并将该部分参数进行剔除。3.根据权利要求1或2所述的基于注意力机制的高炉热负荷异常状态监测方法,其特征是,所述的数据清洗过程中对实际采集的数据进行缺失值、异常值以及量纲不一致问题处理,采用上一时刻数据填充法对缺失的数据进行填充;对所采集的参数中存在的异常点利用箱型图法进行筛选剔除,并采用上一时刻值对所剔除的点进行填充;对所采集的参数值利用最大

最小值归一化方法进行标准化处理。4.根据权利要求2所述的基于注意力机制的高炉热负荷异常状态监测方法,其特征是,所述的互信息是描述两个随机变量之间相互依存关系强弱的信息度量方法,对于高炉炼铁过程的相关参数与高炉热负荷变量;所述的连续随机变量互信息求取方法,分别对各项参数与热负荷值进行关联分析,具体为:其中:p(x
i
,y)为当前参数X
i
与热负荷值Y的联合概率密度函数,而p(x
i
)和p(y)分别为当前参数X
i
和热负荷值Y的边缘概率密度函数,通过互信息得到每个参数与热负荷值之间的互信息值,之后依据互信息值进行倒序排列,挑选出与目标值关联性较强的特征参数;所述的基于互信息的特征选择,通过算法实现无关参数的自动过滤与特征维度缩减:所采集的高炉炼铁数据中包含温度、料速、煤比、焦比诸多量化参数,参数之间存在线性相关关系,表现出一定的参数冗余,无法准确判断其中对高炉热负荷具有直接关联影响的参数;当将所有参数同时作为输入变量,则有可能因为参数之间的冗余,增加预测模型对输入参数的敏感性,降低模型的鲁棒性;因此,通过设计特征选择方法从诸多变量中挑选出与目标值直接关联的低冗余特征,并以此作为输入,实现基于关键影响因素作为输入的预测建模。5.根据权利要求1所述的基于注意力机制的高炉热负荷异常状态监测方法,其特征是,所述的双层一维卷积神经网络结构,具体包括:输入层、卷积层、池化层、全连接层和输出层,其中:CNN通过逐层的卷积和池化操作提取数据特征,经过多个滤波器操作之后,最终将这些高维数据特征转化为低维数据特征,并输入全连接层进行进一步的回归或分类分析;
在一维卷积层中,输入的数据信息在流向下一层之前需要经过卷积操作和激活函数的计算,具体为:h
t
=σ
cnn
(W
cnn
*x
t
+b
cnn
),其中:W
cnn
为滤波器的权重系数,即卷积核;x
t
为第t个输入样本数据信息;*为x
t
与W
cnn
之间的离散卷积运算;b
cnn
为偏置参数,该参数主要通过对模型进行训练时学习获得;σ
cnn
(
·
)为激活函数;h
t
为卷积操作结束后的输出数据;所述的一维卷积神经网络中,卷积操作在层与层之间建立映射关系,为进...

【专利技术属性】
技术研发人员:许鸿伟秦威孙衍宁
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1