基于时空图神经网络的PM2.5浓度时空变化预测方法及系统技术方案

技术编号:31836019 阅读:44 留言:0更新日期:2022-01-12 13:14
本发明专利技术涉及一种基于时空图神经网络的PM2.5浓度时空变化预测方法及系统。获取各个大气监测站点的大气污染物浓度监测历史数据、全国气象站的气象数据、预测气象数据以及高程数据;构建样本,使用各个大气监测站点经纬度构造邻接矩阵M和权重矩阵W;构建基于时空图神经网络模型预测各个站点预测结果,获取对应的PM2.5浓度预测值。本发明专利技术以全国约1500个大气监测站点观测数据为训练集,结合气象、高程等多种数据源,使用基于时空图神经网络,构建一个统一的预测框架,可以同时预测大区域内的PM2.5浓度变化,并且提高预测精度。并且提高预测精度。并且提高预测精度。

【技术实现步骤摘要】
基于时空图神经网络的PM2.5浓度时空变化预测方法及系统


[0001]本专利技术涉及气象预测
,尤其涉及一种基于时空图神经网络的 PM2.5浓度时空变化预测方法及系统。

技术介绍

[0002]空气污染是影响健康的主要环境问题之一。准确的大气污染短期预测可以为政府决策提供依据,及时做出预防措施,减少污染事件的发生。
[0003]现有的PM2.5预测方法主要分为机理模型和数据驱动方法。机理模型通过模拟已知的物理规律,输入所需的历史观测数据对模型进行初始化即可进行预测,但由于对污染物形成的机理过程尚未完全探明,也受计算资源的限制,无法充分模拟,此类方法的预测精度较低。数据驱动方法包括传统的经验统计方法和目前较为流行的机器学习方法,在机器学习方法中,由于LSTM 模型擅长处理时序数据,因此最多被用来进行PM2.5浓度的预测。一般的做法是,使用大气监测站点的历史污染物浓度以及一些气象观测数据作为模型输入,使用预测时刻后一段时间的PM2.5浓度作为标签,建立训练数据集,训练LSTM模型。最后将实时观测数据作为输入,预测当前时刻后一段时间的 PM2.5浓度变化。这种做法的缺点是,它仅使用单个站点的历史观测作为输入,从历史数据中学习时序关系,并且仅使用局部区域的少数站点数据训练模型,并没有考虑到污染物在空间上的传输过程。而事实上很多污染事件是外源性的,边界层传输是区域间污染物交换的重要过程之一,高程、地形、风速等条件也会影响污染物的传输。因此,现有方法大多仅考虑时间关系而没有考虑空间关系,预测的准确度有待提高。
>
技术实现思路

[0004]针对现有技术中存在的问题,本专利技术提供一种基于时空图神经网络的 PM2.5浓度时空变化预测方法及系统,以全国约1500个大气监测站点观测数据为训练集,结合气象、高程等多种数据源,使用时序图神经网络同时考虑大气污染物的时序变化和空间上的传输过程,构建一个统一的预测框架,可以同时预测大区域内的PM2.5浓度变化,并且提高预测精度。
[0005]为达到上述目的,本专利技术提供了一种基于时空图神经网络的PM2.5浓度时空变化预测方法,包括:
[0006]获取各个大气监测站点的大气污染物浓度监测历史数据、全国气象站的气象数据、气象预报数据以及高程数据;
[0007]确定单个样本的历史输入时长p和预测时长q;构建样本,包括时刻t 之前p小时各个大气监测站点的大气污染物浓度监测历史数据、站点编号、经纬度、高程、时间变量、最近气象站的气象数据,时刻t之后q小时的气象预报数据和时间变量;时刻t之后q小时的PM2.5浓度作为训练样本的标签;样本数据进行归一化处理后,形成训练样本集;
[0008]使用各个大气监测站点经纬度构造邻接矩阵M和权重矩阵W;
[0009]构建基于时空图神经网络的预测模型;
[0010]将邻接矩阵M和权重矩阵W输入所述基于时空图神经网络的预测模型,由所述样本数据集中选择样本,训练所述基于时空图神经网络的预测模型,直至输出的预测结果满足精度要求;
[0011]采集目标监测站点的预测时刻之前p小时各个大气监测站点的大气污染物浓度监测历史数据、站点编号、经纬度、高程、时间、最近气象站的气象数据、预测时刻之后q小时的气象预报数据和时间;进行归一化处理后输入所述基于时空图神经网络模型;
[0012]所述基于时空图神经网络的预测模型输出各个站点预测结果,获取对应的PM2.5浓度预测值。
[0013]进一步地,构建训练数据的步骤包括:
[0014]检查所有数据的时间序列完整性,去除有缺失值和异常值的数据;
[0015]从t

p到t+q范围内的时刻中提取时间戳、儒略日、月份、星期和小时作为时间变量;
[0016]使用大气监测站点经纬度构造邻接矩阵M和权重矩阵W;
[0017]遍历所有时间的数据,通过滚动时间窗截取数据:获取时刻t之前p小时各个大气监测站点的监测数据、站点编号、经纬度、高程,该大气监测站点在t之后q小时的PM
2.5
浓度,作为训练样本的标签;各个大气监测站点距离最近的气象站,获取时刻t之前p小时的气象观测数据,运行NWP得到时刻t之后q小时的气象预报数据;
[0018]将时刻t之前p小时各个大气监测站点的大气污染物浓度监测历史数据、站点编号、高程、时间变量、最近气象站的气象数据合并,形成数据维度为 n
×
p
×
m1,n为站点数量,m1为历史输入特征个数;将时刻t之后q小时的气象预报数据和时间变量作为未来输入数据,数据维度为n
×
q
×
m2,m2为未来输入特征个数;输出维度为n
×
q
×
1,代表n个站点在未来q个时刻的PM
2.5
数值。
[0019]进一步地,使用大气监测站点经纬度构造邻接矩阵M和权重矩阵W,包括:
[0020]将大气监测站点的经纬度转换为弧度;
[0021]第i个和第j个大气监测站点之间的距离D(i,j)为:
[0022][0023]其中(x
i
,y
i
)和(x
j
,y
j
)分别为第i个和第j个大气监测站点的弧度坐标;M
ij
为邻接矩阵M的第i行第j列的数值;设定距离阈值S,距离D(i,j)小于S,则M
ij
为1,否则为0,得到邻接矩阵M;
[0024]使用高斯核函数计算M
ij
为1的大气监测站点之间边的权重W
ij
,M
ij
为0 的大气监测站点之间边的权重W
ij
为0,得到边的权重矩阵W;
[0025][0026]其中σ为所有距离D(i,j)的标准差,W
ij
为权重矩阵W第i行第j列的数值。
[0027]进一步地,所述基于时空图神经网络模型包括,第一GCLSTM网络、第二 GCLSTM网络以及全连接层;
[0028]所述第一GCLSTM网络的输入为邻接矩阵M和权重矩阵W、时刻t之前p 小时各个大
气监测站点的大气污染物浓度监测历史数据、站点编号、经纬度、高程、最近气象站的气象数据;
[0029]所述第二GCLSTM网络的输入为邻接矩阵M和权重矩阵W、时刻t之后q 小时的预测气象数据以及所述第一GCLSTM网络的隐藏变量和未来输入特征;
[0030]所述第二GCLSTM网络的输出到所述全连接层,所述全连接层输出各个站点q个小时的预测结果。
[0031]进一步地,大气污染物浓度监测历史数据包括PM
2.5
,PM
10
,O3,CO,NO2和SO2浓度监测历史数据;气象数据包括温度变化、湿度和风速;预测气象数据采用NWP气象预报数据。
[0032]进一步地,将样本数据集划分为训练集、验证集和测试集;本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于时空图神经网络的PM2.5浓度时空变化预测方法,其特征在于,包括:获取各个大气监测站点的大气污染物浓度监测历史数据、全国气象站的气象数据、气象预报数据以及高程数据;确定单个样本的历史输入时长p和预测时长q;构建样本,包括时刻t之前p小时各个大气监测站点的大气污染物浓度监测历史数据、站点编号、经纬度、高程、时间变量、最近气象站的气象数据,时刻t之后q小时的气象预报数据和时间变量;时刻t之后q小时的PM2.5浓度作为训练样本的标签;样本数据进行归一化处理后,形成训练样本集;使用各个大气监测站点经纬度构造邻接矩阵M和权重矩阵W;构建基于时空图神经网络的预测模型;将邻接矩阵M和权重矩阵W输入所述基于时空图神经网络的预测模型,由所述样本数据集中选择样本,训练所述基于时空图神经网络的预测模型,直至输出的预测结果满足精度要求;采集目标监测站点的预测时刻之前p小时各个大气监测站点的大气污染物浓度监测历史数据、站点编号、经纬度、高程、时间、最近气象站的气象数据、预测时刻之后q小时的气象预报数据和时间;进行归一化处理后输入所述基于时空图神经网络模型;所述基于时空图神经网络的预测模型输出各个站点预测结果,获取对应的PM2.5浓度预测值。2.根据权利要求1所述的基于时空图神经网络的PM2.5浓度时空变化预测方法,其特征在于,构建训练数据的步骤包括:检查所有数据的时间序列完整性,去除有缺失值和异常值的数据;从t

p到t+q范围内的时刻中提取时间戳、儒略日、月份、星期和小时作为时间变量;使用大气监测站点经纬度构造邻接矩阵M和权重矩阵W;遍历所有时间的数据,通过滚动时间窗截取数据:获取时刻t之前p小时各个大气监测站点的监测数据、站点编号、经纬度、高程,该大气监测站点在t之后q小时的PM
2.5
浓度,作为训练样本的标签;各个大气监测站点距离最近的气象站,获取时刻t之前p小时的气象观测数据,运行NWP得到时刻t之后q小时的气象预报数据;将时刻t之前p小时各个大气监测站点的大气污染物浓度监测历史数据、站点编号、高程、时间变量、最近气象站的气象数据合并,形成数据维度为n
×
p
×
m1,n为站点数量,m1为历史输入特征个数;将时刻t之后q小时的气象预报数据和时间变量作为未来输入数据,数据维度为n
×
q
×
m2,m2为未来输入特征个数;输出维度为n
×
q
×
1,代表n个站点在未来q个时刻的PM
2.5
数值。3.根据权利要求2所述的基于时空图神经网络的PM2.5浓度时空变化预测方法,其特征在于,使用大气监测站点经纬度构造邻接矩阵M和权重矩阵W,包括:将大气监测站点的经纬度转换为弧度;第i个和第j个大气监测站点之间的距离D(i,j)为:其中(x
i
,y
i
)和(x
j
,y
j
)分别为第i个和第j个大气监测站点的弧度坐标;M
ij
为邻接矩阵M的第i行第j列的数值;设定距离阈值S,距离D(i,j)小于S,则M
ij
为1,否则为0,得到邻接矩阵
M;使用高斯核函数计算M
ij
为1的大气监测站点之间边的权重W
ij
,M
ij
为0的大气监测站点之间边的权重W
ij
为0,得到边的权重矩阵W;其中σ为所有距离D(i,j)的标准差,W
ij
为权重矩阵W第i行第j列的数值。4.根据权利要求1或2所述的基于时空图神经网络的PM2.5浓度时空变化预测方法,其特征在于,所述基于时空图神经网络模型包括,第一GCLSTM网络、第二GCLSTM网络以及全连接层;所述第一GCLSTM网络的输入为邻接矩阵M和权重矩阵W、时刻t之前p小时各个大气监测站点的大气污染物浓度监测历史数据、站点编号、经纬度、高程、最近气象站的气象数据;所述第二GCLSTM网络的输入为邻接矩阵M和权重矩阵W、时刻t之后q小时的预测气象数据以及所述第一GCLSTM网络的隐藏变量和未来输入特征;所述第二GCLSTM网络的输出到所述全连接层,所述全连接层输出各个站点q个小时的预测结果。5.根据权利要求1或2所述的基于时空图神经网络的PM2.5浓度时空变化预测方法,其特征在于,大气污染物浓度监测历史数据包括PM
2.5
,PM
10
,O3,CO,NO2和SO2浓度监测历史数据;气象数据包括温度变化、湿度和风速;预测气象数据采用NWP气象预报数据。6.根据权利要求1或2所述的基于时空图神经网络的PM2.5浓度时空变化预测方法,其特征在于,将样本数据集划分为训练集、验证集和测试集;分别对训练集、验证集和测试集中训练样本、验证样本和测试样本;训练步骤包括:选择训练样本对所述基于时空图神经网络模型,当满足训练要求后,进...

【专利技术属性】
技术研发人员:徐崇斌左欣王鑫磊吴俣陈前孙晓敏杨勇刘亮
申请(专利权)人:北京航天创智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1