一种基于ST-Informer预测模型的PM2.5浓度预测方法技术

技术编号:37664624 阅读:14 留言:0更新日期:2023-05-26 04:22
本发明专利技术属于PM2.5浓度预测技术领域,公开了一种基于ST

【技术实现步骤摘要】
一种基于ST

Informer预测模型的PM2.5浓度预测方法


[0001]本专利技术属于PM2.5浓度预测
,具体涉及一种基于ST

Informer预测模型的PM2.5浓度预测方法。

技术介绍

[0002]随着我国工业化和城市化的快速发展,城市空气污染问题日益恶化,严重影响了人们的生活质量、身体健康和生产活动。为了减少空气的污染,相关部门提出了雾霾治理、改善环境质量等重要举措。
[0003]PM2.5作为空气污染物的主要成分,准确预测PM2.5浓度对于空气污染治理和风险规避有着重要的现实意义。然而,PM2.5往往受到各种外部因素的影响,具有复杂的时间、空间依赖性。因此,构建一个高精度、高效率的PM2.5预测方法仍是当前亟待解决的科学问题。
[0004]PM2.5浓度数据是典型的时空序列数据,空气污染物的传播以及气象特征的影响都是PM2.5预测过程中需要考虑的因素。目前,广泛应用于空气污染物浓度的预测有深度学习模型,例如:循环神经网络(Recurrent Neural Net,RNN)。RNN虽然能够有效解决时序数据预测的问题,但是当输入的序列过长时,会产生梯度爆炸等问题。为此,有学者在研究Transformer模型的基础上,提出一种改进的模型(即Informer模型)预测PM2.5浓度,Informer模型虽然在一定程度上解决了RNN不能进行长序列数据限制,但是该模型缺少动态时空特征提取能力,预测精度不足。

技术实现思路

[0005]鉴于此,为解决上述
技术介绍
中所提出的问题,本专利技术的目的在于提供一种基于ST

Informer预测模型的PM2.5浓度预测方法。该方法在Informer模型的基础上引入了时空嵌入层来捕获数据的时空相关性,以此不仅能够准确地捕捉输出与输入之间的长期依赖关系,而且预测精度和计算效率相比于现有的PM2.5预测模型得到了明显提高。
[0006]为实现上述目的,本专利技术提供如下技术方案:
[0007]一种基于ST

Informer预测模型的PM2.5浓度预测方法,包括:
[0008]S1.在目标范围内设置若干监测站点,通过所述监测站点采集所述目标范围内的气象数据和空气污染物浓度数据,得到数据集;
[0009]所述数据集中气象数据包括温度、气压、露点、降雨量、风向和风速;
[0010]所述数据集中所述空气污染物浓度数据包括PM2.5浓度、PM10浓度、SO2浓度、NO2浓度、CO浓度和O3浓度;
[0011]S2.对数据集进行数据预处理和时空相关性分析,得到数据时空矩阵;
[0012]S3.在Informer模型中构建时空嵌入层,得到ST

Informer预测模型;所述时空嵌入层包括时间嵌入层、空间嵌入层和值嵌入层;
[0013]S4.利用所述数据时空矩阵优化训练所述ST

Informer预测模型;
[0014]S5.以所述监测站点实时采集的气象数据和空气污染物浓度数据为输入量,并基
于所述输入量与优化训练后的所述ST

Informer预测模型预测所述目标范围内的PM2.5浓度。
[0015]综上,与现有技术相比,本专利技术具有以下有益效果:
[0016](1)在本专利技术预测方法中,收集的数据集包括多个监测站点的气象数据和空气污染物浓度数据,该数据集不单是时序数据,也存在空间依赖性,因此,通过该数据集所训练得到的ST

Informer预测模型在预测PM2.5浓度时可以从时间、空间上进行分析,进而使得模型的预测效果更佳。
[0017](2)利用适合于长序列预测的Informer模型作为本专利技术的基础模型,并且在该基础模型中引入了时空嵌入层来捕获数据的时空相关性,以此不仅能提取数据之间复杂的非线性特性,还能准确捕捉输出与输入之间的长期依赖关系,进而有效提升了本专利技术ST

Informer预测模型及预测方法在预测PM2.5浓度上的精确度。
[0018]优选的,所述数据预处理包括异常值检验、缺失值填充和归一化处理。
[0019]所述异常值检验为:构建检验阈值范围,并判断处于所述检验阈值范围之外的数据为异常缺失数据。
[0020]所述缺失值填充为:基于KNN算法识别与所述异常缺失数据相邻的K个邻接数据,取所述K个邻接数据的平均值替代所述异常缺失数据。
[0021]所述归一化处理的归一化公式为:式中,Y
i
为所述数据集中第i个数据的归一化值,X
i
为所述数据集中第i个数据的数据值,X
min
为所述数据集中的最小数据值,X
max
为所述数据集中的最大数据值。
[0022]优选的,所述时空相关性分析采用Pearson相关系数计算:
[0023]式中,X和Y别代表两个变量,cov(X,Y)代表两个变量之间的协方差,σ
X
σ
Y
代表两个变量之间的标准差。
[0024]优选的,所述数据时空矩阵为二维时空矩阵X(X∈R
T
×
S
×
W
);式中,T代表时滞,S代表监测站点信息,W代表空气污染物和气象特征。
[0025]优选的,在所述时间嵌入层中:
[0026]通过位置编码表示数据的时间特征式中,d
model
代表数据经过输入层映射后的维度;pos代表一行数据中某个映射特征在数据中的位置;2i、2i+1代表数据的行数;
[0027]所述时间特征通过具有时间戳的向量化索引E
T
输出。
[0028]优选的,所述空间嵌入层通过如下公式计算数据的空间特征:
[0029]E
S
=w
×
S
t
×
Z
t
+b;式中
[0030]S
t
代表t时刻监测站点之间的相关性强度,S
t
=S
t,ij
=xcorr(Z
t,i
,Z
t,j
),i、j分别为监测站点i和监测站点j;
[0031]Z
t
代表t时刻数据在高维子空间的投影值,Z
t
=w
×
X
t
+b。
[0032]优选的,在所述值嵌入层中:
[0033]使用输入维度为d
model
的一维卷积将数据用高维表示为Ev;
[0034]将监测站点之间的相关性强度作为权重来调整所有监测站点数据的高维表示Ev;
[0035]融合数据的时间特征和空间特征,并将融合后的特征表示为特征向量:
[0036]将所述特征向量输入至所述Informer模型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于ST

Informer预测模型的PM2.5浓度预测方法,其特征在于,包括如下步骤:S1.在目标范围内设置若干监测站点,通过所述监测站点采集所述目标范围内的气象数据和空气污染物浓度数据,得到数据集;所述数据集中气象数据包括温度、气压、露点、降雨量、风向和风速;所述数据集中所述空气污染物浓度数据包括PM2.5浓度、PM10浓度、SO2浓度、NO2浓度、CO浓度和O3浓度;S2.对数据集进行数据预处理和时空相关性分析,得到数据时空矩阵;S3.在Informer模型中构建时空嵌入层,得到ST

Informer预测模型;所述时空嵌入层包括时间嵌入层、空间嵌入层和值嵌入层;S4.利用所述数据时空矩阵优化训练所述ST

Informer预测模型;S5.以所述监测站点实时采集的气象数据和空气污染物浓度数据为输入量,并基于所述输入量与优化训练后的所述ST

Informer预测模型预测所述目标范围内的PM2.5浓度。2.根据权利要求1所述的PM2.5浓度预测方法,其特征在于:所述数据预处理包括异常值检验、缺失值填充和归一化处理。3.根据权利要求2所述的PM2.5浓度预测方法,其特征在于,所述异常值检验为:构建检验阈值范围,并判断处于所述检验阈值范围之外的数据为异常缺失数据。4.根据权利要求3所述的PM2.5浓度预测方法,其特征在于,所述缺失值填充为:基于KNN算法识别与所述异常缺失数据相邻的K个邻接数据,取所述K个邻接数据的平均值替代所述异常缺失数据。5.根据权利要求4所述的PM2.5浓度预测方法,其特征在于:所述归一化处理的归一化公式为:式中,Y
i
为所述数据集中第i个数据的归一化值,X
i
为所述数据集中第i个数据的数据值,X
min
为所述数据集中的最小数据值,X
max
为所述数据集中的最大数据值。6.根据权利要求5所述的PM2.5浓度预测方法,其特征在于:所述时空相关性分析采用Pearson相关系数计算:式中,X和Y别代表两个...

【专利技术属性】
技术研发人员:马占飞罗雯丽马子渊马钰松李学宝郑磊崔连伟
申请(专利权)人:四川农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1