一种基于注意力机制的PM2.5浓度预测的方法技术

技术编号:37767396 阅读:13 留言:0更新日期:2023-06-06 13:28
本发明专利技术属于人工智能和环境科学领域,具体的说是一种基于注意力机制的PM2.5浓度预测的方法,该方法首先将空气污染物(PM2.5、PM10、SO2等)进行预处理,通过阈值判定、K

【技术实现步骤摘要】
一种基于注意力机制的PM2.5浓度预测的方法


[0001]本专利技术属于人工智能和环境科学领域,具体的说是一种基于注意力机制的PM2.5浓度预测的方法。

技术介绍

[0002]近些年来,经济将得到了快速发展,但是的经济发展是以资源的超常消耗和生态的严重恶化为代价的。空气污染物超标排放,这些物质对人类健康具有长期性影响,不但严重影响了人们的正常学习和工作,也给社会造成了巨大的损失。
[0003]空气质量监测站的数据的监测与采集,由于自身存在物理性缺点,易受外界环境因素的干扰,会导致采集的数据失真,数据存在一定的偏差,对于日常数据的异常检测和维护更多的是靠人工去进行。这样耗费大量的人力物力,并且工作效率低,人工检测会存在大量的漏检,错检。

技术实现思路

[0004]为提高空气质量数据的分析和环境预警能力,本专利技术提出一种基于Attention

LSTM的PM2.5污染物小时浓度预测的方法。通过对历史时间序列的空气污染物数据建模,更准确的预测未来PM2.5污染物小时浓度。
[0005]本专利技术为实现上述目的所采用的技术方案是:
[0006]一种基于注意力机制的PM2.5浓度预测的方法,包括以下步骤:
[0007]获取空气污染物浓度历史小时数据,并对其进行预处理;
[0008]将预处理后的数据分为训练集和测试集,并对训练集数据进行标准化处理;
[0009]构建Attention

LSTM神经网络预测模型,并使用训练集数据对其进行训练;
[0010]将测试集数据输入到训练好的预测模型中进行预测,得到未来PM2.5污染物的小时浓度。
[0011]所述预处理包括以下步骤:
[0012]1)去除数据中除PM2.5污染物小时浓度数据以外的数据;
[0013]2)使用阈值标记噪声数据,并去除;
[0014]3)使用K

means算法得到异常点数据,并去除;
[0015]4)用过去24小时平均数据填充去除的噪声数据和异常点数据。
[0016]所述使用K

means算法得到异常点数据,具体为:使用拐点法确定K值,即分类的类别数量,在每一个类别中,分别计算每一个数据点到聚类中心的距离,每一类别设置一个阈值,将距离超过阈值的数据点作为异常点数据。
[0017]所述Attention

LSTM神经网络预测模型包括顺次连接的输入层、两个LSTM层、Attention层、全连接层以及输出层。
[0018]所述使用训练集数据对其进行训练,包括以下步骤:
[0019]a)将训练集数据输入到Attention

LSTM神经网络预测模型中;
[0020]b)根据预设的超参数对模型进行训练,根据模型输出的预测值与实际值的误差,使用反向传播算法调整神经网络预测模型的权值跟偏置,神经网络预测模型训练到预设的次数后,保存神经网络预测模型;
[0021]c)输入测试集的数据,获得未来PM2.5污染物的小时浓度的预测值所为测试结果;
[0022]d)调整神经网络预测模型的超参数,重复步骤b)至步骤c),选取得到的所有预测值中与测试集中实际值MSE最小的神经网络预测模型作为最终的Attention

LSTM神经网络预测模型。
[0023]所述的超参数为:优化器,优化器学习率、每一批次输入数据的数量、权重衰减系数。
[0024]一种基于注意力机制的PM2.5浓度预测系统,包括:
[0025]数据获取模块,用于获取空气污染物浓度历史小时数据,并对其进行预处理;
[0026]数据处理模块,用于将预处理后的数据分为训练集和测试集,并对训练集数据进行标准化处理;
[0027]模型训练模块,用于构建Attention

LSTM神经网络预测模型,并使用训练集数据对其进行训练;
[0028]数据预测模块,用于将测试集数据输入到训练好的预测模型中进行预测,得到未来PM2.5污染物的小时浓度。
[0029]一种基于注意力机制的PM2.5浓度预测系统,包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现所述的一种基于注意力机制的PM2.5浓度预测的方法。
[0030]一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现所述的一种基于注意力机制的PM2.5浓度预测的方法。
[0031]本专利技术具有以下有益效果及优点:
[0032]1.数据处理:使用多种方法对获得的历史序列数据进行处理,识别出更多的异常点,提高了数据质量,有利于后续模型的训练。
[0033]2.Attention

LSTM神经网络:由于历史序列数据太长,传统的预测模型会弱化长距离的信息,导致预测效果不好。Attention

LSTM神经网络能够捕捉到更远的时间序列数据,将有限的注意力集中在重点信息上,从而节省资源,快速获得最有效的信息。
附图说明
[0034]图1是本专利技术方法的流程图;
[0035]图2是Attention

LSTM神经网络结构图;
[0036]图3是PM2.5污染物小时浓度的实际值和预测值。
具体实施方式
[0037]下面结合附图及实施例对本专利技术做进一步的详细说明。
[0038]如图1所示,一种基于Attention

LSTM的PM2.5污染物小时浓度预测的方法。具体实施步骤如下:
[0039]步骤1:数据采集与预处理。从数据库中获得空气污染物浓度历史小时数据,删除
与预测任务无关的字段,设定阈值初步标记噪声数据,用过去24小时平均数据去填充缺失值和噪声,使用K

means算法,用拐点法确定K值为5,即将类别分为5类。在分出来的5个类别中,分别用不同的阈值计算该类中所有点到聚类中心的距离,将超出阈值的点标记为异常点。用过去24小时平均数据去替换异常点。
[0040]步骤2:将步骤1处理后的数据集分为训练集和测试集。对训练集进行标准化处理使数据分布满足N(0,1)分布。使用X表示所有训练集数据中的某小时空气污染物浓度值,X
mean
表示所有训练集数据中的平均值,X
std
表示所有训练集数据中的标准差,利用以下公式计算训练集数据中,某一个变量标准化后的数据X
norm

[0041][0042]图2为Attention

LSTM神经网络的结构,具体如下:
[0043]Attention

LSTM是LSTM神经网络跟Attention机制的融合。LSTM层的作用是为了选择记住重要的信息本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制的PM2.5浓度预测的方法,其特征在于,包括以下步骤:获取空气污染物浓度历史小时数据,并对其进行预处理;将预处理后的数据分为训练集和测试集,并对训练集数据进行标准化处理;构建Attention

LSTM神经网络预测模型,并使用训练集数据对其进行训练;将测试集数据输入到训练好的预测模型中进行预测,得到未来PM2.5污染物的小时浓度。2.根据权利要求1所述的一种基于注意力机制的PM2.5浓度预测的方法,其特征在于,所述预处理包括以下步骤:1)去除数据中除PM2.5污染物小时浓度数据以外的数据;2)使用阈值标记噪声数据,并去除;3)使用K

means算法得到异常点数据,并去除;4)用过去24小时平均数据填充去除的噪声数据和异常点数据。3.根据权利要求2所述的一种基于注意力机制的PM2.5浓度预测的方法,其特征在于,所述使用K

means算法得到异常点数据,具体为:使用拐点法确定K值,即分类的类别数量,在每一个类别中,分别计算每一个数据点到聚类中心的距离,每一类别设置一个阈值,将距离超过阈值的数据点作为异常点数据。4.根据权利要求1所述的一种基于注意力机制的PM2.5浓度预测的方法,其特征在于,所述Attention

LSTM神经网络预测模型包括顺次连接的输入层、两个LSTM层、Attention层、全连接层以及输出层。5.根据权利要求1所述的一种基于注意力机制的PM2.5浓度预测的方法,其特征在于,所述使用训练集数据对其进行训练,包括以下步骤:a)将训练集数据输入到Attention

LSTM神经网络预测模型中;b)根据预设的超参数对模型进行训练,...

【专利技术属性】
技术研发人员:张镝王宁杨柳杜毅明武暕康利荥白雪周晓鸥
申请(专利权)人:中国科学院沈阳计算技术研究所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1