一种基于多变量多步LSTM模型的气体浓度预测方法技术

技术编号:34698574 阅读:21 留言:0更新日期:2022-08-27 16:34
本发明专利技术提供一种基于多变量多步LSTM模型的气体浓度预测方法,属于环境气体检测领域。该方法包括:1)对多种气体浓度及温度的时间序列数据做预处理及关联分析,选择指标气体;2)利用指标气体浓度及温度时序数据构建滑动窗口数据集;3)构建多变量多步LSTM模型;4)训练模型;5)用验证集验证评估模型;6)用测试集测试模型,选择最优模型参数;7)用构建的模型对现场气体浓度进行预测。本发明专利技术基于多变量多步LSTM模型的实现了多种气体浓度的同时预测,为环境气体监测提供了一套完整、高效、可行的解决方案,具有较高的应用价值及推广价值。具有较高的应用价值及推广价值。具有较高的应用价值及推广价值。

【技术实现步骤摘要】
一种基于多变量多步LSTM模型的气体浓度预测方法


[0001]本专利技术涉及气体浓度的预测,具体涉及一种基于多变量多步LSTM模型的气体浓度预测方法,属于环境气体检测领域。

技术介绍

[0002]在我国经济不断发展的背景下,人们的生活水平得到了显著的提高,但是因经济发展带来的环境污染问题也越来越严重,特别是近几年,人口总量不断增加,经济快速发展,大量排放的汽车尾气、工厂废气等都对大气环境造成了严重污染,还出现了雾霾现象。已经严重威胁到人们的健康。面对当今社会的环境问题,有效解决的前提就是实行环境气体监测。因此,通过技术对有害气体浓度进行检测、分析、提出合理有效的解决措施是很有必要的。
[0003]在煤矿安全生产管理当中,气体浓度监测也占据着重要地位,及时对煤矿气体浓度进行检测不仅能保障人民的生命财产安全,还能促进煤矿安全防控技术发展。煤矿热动力耦合灾害是危害性极大的灾害,它的发生严重威胁矿井生产和井下工人的生命安全,同时有害气体直接影响工人的身体健康甚至使人窒息死亡。针对煤矿安全尤其是爆炸相关的气体浓度预测得到了研究者的广泛重视。
[0004]20世纪70年代前,大多采用人工取样对气体进行分析,效率低。随着机器学习的发展,如人工神经网络、支持向量机、专家系统等开始应用于环境气体检测(赵羚宇.基于神经网络的危险气体扩散预测模型研究[D].中国石油大学(北京),2020.DOI:10.27643/d.cnki.gsybu.2020.001534.)。同时,机器学习也广泛用于采空区灾害气体的定量评价与分析中(付华.煤矿瓦斯灾害特征提取与信息融合技术研究[D].阜新:辽宁工程技术大学,2006.c)。煤与瓦斯含量以及传感器测量得到的氧气、温度或CO等数据属于典型的时间序列,应用时间序列的机器学习预测方法对气体浓度进行预测逐渐成为一种新的趋势。

技术实现思路

[0005]本专利技术的目的在于实现一种基于多变量多步LSTM模型的气体浓度预测方法,能为环境气体监测提供了一套完整、高效、可行的解决方案。
[0006]本专利技术提供的一种基于多变量多步LSTM模型的气体浓度预测方法,具体包括:1)对输入的多种气体浓度及温度的时间序列数据做预处理,选择关键的指标气体;2)利用所选取指标气体浓度及温度时间序列数据构建滑动窗口数据集;3)构建多变量多步LSTM模型;4)训练多变量多步LSTM模型;5)用验证集对训练好的模型进行验证评估;6)用测试集测试多变量多步模型,调整并选择最优模型参数;7)用构建的模型对现场气体浓度进行预测;具体来说,本专利技术的方法包括下列步骤:
[0007]A.对输入的多种气体浓度及温度的时间序列数据做预处理,选择关键的指标气体,具体步骤如下:
[0008]A1.将输入的多种气体浓度及温度的时间序列数据做归一化处理;
[0009]A2.分析不同气体浓度与温度之间以及不同气体浓度两两之间的关联关系;
[0010]A3.综合步骤A2的结果,选择相关性最大的K种气体以及温度做气体浓度预测;
[0011]B.利用所选取的K种指标气体浓度及温度时间序列数据构建滑动窗口数据集,具体步骤如下:
[0012]B1.选取指标气体1的时间序列数据记为A,A={a
i
},i>=1;a
i
表示第i个时间节点的气体浓度值;
[0013]B2.构造一个长度为L,滑动步长为S的滑动窗口,窗口从a1开始滑动提取时间序列数据中的元素形成滑动窗口数据集;其中,L>=1,S>=1,具体步骤如下:
[0014]B2.1选取a1至a
1+L
的元素构成第一个样本w
11
=(D
x1
,D
y1
),D
x1
作为模型的输入值,记为D
x1
={a
i
},1<=i<=L;D
y1
作为模型的期望输出,D
y1
=a
1+L

[0015]B2.2选取a
1+S
至a
1+L+S
的元素构成第二个样本w
12
=(D
x2
,D
y2
),D
x2
作为模型的输入值,记为D
x2
={a
i+S
},1<=i<=L;D
y2
作为模型的期望输出,D
y2
=a
1+L+S

[0016]B2.3按照步骤B2.1和B2.2所述方式构造后续的样本w
1t
,3<=t<=N,N表示预设的样本个数;
[0017]B2.4样本1到样本N构成气体1的滑动窗口数据集,记为W1,W1={w
1t
},1<=t<=N;
[0018]B3.按照步骤B1和B2所述方式为K种指标气体及温度分别构建滑动窗口数据集;
[0019]B4.将温度及所有气体的滑动窗口数据集合并为样本集W={W
j
},1<=j<=K+1;
[0020]B5.按比例r1:r2:r3将样本集划分为训练集O、验证集P和测试集Q,每个集合的样本个数记为No,Np,Nq;训练集用于模型训练,验证集用于模型评估,测试集用于模型测试;
[0021]C.构建多变量多步LSTM模型,具体步骤如下:
[0022]C1.构建LSTM1,单元状态记为Ct1,隐藏状态记为Ht1;
[0023]C2.构建LSTM2,将Ct1和Ht1传输给LSTM2,LSTM2的单元状态记为Ct2,隐藏状态记为Ht2;
[0024]C3.重复以上操作,将K+1个LSTM单元并联成为多变量多步LSTM模型,记为mLSTM,mLSTM={LSTM
j
},1<=j<=K+1;
[0025]D.训练mLSTM,具体步骤如下:
[0026]D1.设定训练的超参数,包括模型初始化的随机种子数seed、学习率lr、模型训练总轮数epoch,一个训练批次的样本个数batch_size;
[0027]D2.根据设定的随机种子数seed初始化mLSTM状态种子;
[0028]D3.获取训练集O,记为O={o
ji
},1<=i<=No,1<=j<=K+1;
[0029]D4.用batch_size个样本作为一批数据训练模型,1<=batch_size<=No,具体步骤如下:
[0030]D4.1把第j列的样本集O
j
当中的batch_本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多变量多步LSTM模型的气体浓度预测方法,其步骤包括:A.对输入的多种气体浓度及温度的时间序列数据做预处理,选择关键的指标气体;B.利用所选取的K种指标气体浓度及温度时间序列数据构建滑动窗口数据集,C.构建多变量多步LSTM模型,具体步骤如下:C1.构建LSTM1,单元状态记为Ct1,隐藏状态记为Ht1;C2.构建LSTM2,将Ct1和Ht1传输给LSTM2,LSTM2的单元状态记为Ct2,隐藏状态记为Ht2;C3.重复以上操作,将K+1个LSTM单元并联成为多变量多步LSTM模型,记为mLSTM,mLSTM={LSTM
j
},1<=j<=K+1;D.训练多变量多步LSTM模型,具体步骤如下:D1.设定训练的超参数,包括模型初始化的随机种子数seed、学习率lr、模型训练总轮数epoch,一个训练批次的样本个数batch_size;D2.根据设定的随机种子数seed初始化mLSTM状态种子;D3.获取训练集O,记为O={o
ji
},1<=i<=No,1<=j<=K+1;D4.用batch_size个样本作为一批数据训练模型,1<=batch_size<=No,具体步骤如下:D4.1把第j列的样本集O
j
当中的batch_size个样本{o
ji
}作为一批数据,1<=j<=K+1,1<=i<=batch_size;D4.2把该批数据中的每个样本o
ji
=(D
xi
,D
yi
)
j
中的D
xi
作为LSTM
j
的输入,得到预测输出y
j
,1<=i<=batch_size;D4.3用该批数据中的每个样本o
ji
=(D
xi
,D
yi
)
j
中的D
yj
作为LSTM
j
的期望输出,用期望输出D
yj
和预测输出y
j
计算每个样本的损失loss;D4.4用该批数据所有样本的损失loss,计算批数据损失mloss;D4.5用批数据损失mloss计算梯度,用梯度和学习率lr更新模型的参数;D5.用全部训练集中的后续批次数据,按照步骤D4所述方式迭代训练并更新模型的参数,直到批数据损失mloss收敛达到预设标准,作为一轮训练;D6.按照epoch的设置重复训练epoch轮,判断批数据损失mloss是否达到预设标准;D7.如批数据损失mloss未达到预设标准,则调整参数lr、epoch以及batch_size,按照步骤D3到D6所述方式迭代训练模型;如已达到指定标准,则结束训练,导出训练好的模型的参数;E.用验证集对训练好的模型进行验证评估,具体步骤如下:E1.获取验证集P,记为P={p
ji
},1<=i<=Np,1<=j<=K+1;E2.把验证集中所有样本输入模型,得到模型的预测结果,具体步骤如下:E2.1把第j列的样本集P
j
当中的每个样本p
ji
=(D
xi
,D
yi
)
j
中的D
xi
作为LSTM
j
的输入,得到预测输出y
j
,1<=i<=Np;E2.2把K+1个LSTM单元的期望输出的集合,记为mLSTM的期望输出;把K+1个LSTM单元的预测输出的集合,记为mLSTM的预测输出;E3.使用mLSTM的期望输出和预测输出,计算均方误差RMSE和平均绝对误差MAE;E4.用RMSE和MAE对模型进行评估,该值越小,表示模型的准确率越高;E5.若准确率没有达到预设标准,则重复D所述步骤,调整滑动窗口数据集的长度L和步
长S、一个训练批次的样本个数batch_size、模型训练总轮数epoch和学习率lr,重新训练模型;F.用测试集测试多变量多步LSTM模型,调整并选择最优模型参数,具体步骤如下:F1.用步骤E所述方...

【专利技术属性】
技术研发人员:赵霞闫晓于重重郑颖李鹏飞冯文彬
申请(专利权)人:中煤科工集团沈阳研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1