基于多任务时空图卷积的空气质量预测方法技术

技术编号:34385830 阅读:48 留言:0更新日期:2022-08-03 21:08
本发明专利技术提出基于多任务时空图卷积的空气质量预测方法。本发明专利技术所述方法使用记忆网络、注意力机制,多层图卷积网络等技术构建基于多任务的深度时空序列数据预测模型,利用单一站点的本地属性和整体站点的全局属性,动态的构建站点间的邻接关系图;利用多层图卷积分别聚合单一站点的时序关系以及邻居站点的空间关系;利用多任务协同训练策略既考虑细粒度站点级别的预测任务,也充分考虑了粗粒度城市级别的预测任务,大大提高了时空序列数据预测效果。果。果。

【技术实现步骤摘要】
基于多任务时空图卷积的空气质量预测方法


[0001]本专利技术属于时空数据挖掘
,特别是涉及基于多任务时空图卷积的空气质量预测方法。

技术介绍

[0002]随着工业化和城市化的不断发展,空气污染如今被认为是全世界人类共同体当前和未来的一个主要问题。空气污染通常被定义为由于人类活动或自然过程引起某些物质进入大气中呈现出足够危害生命健康的浓度。为了减轻人们长期暴露于空气污染的影响,准确的空气质量预测对政府决策以及个人都是至关重要的,例如可以帮助城市管理者制定更好的交通控制决策,大幅减少局部的严重污染(Francesca and Ivo 2008)。然而,由于空气质量与气象(风向、风速、温度等)、路网拓扑结构和区域功能性等因素有着复杂且动态的关系,给空气质量预测任务带来了很多的挑战。由于大气污染物的扩散本质是一个时空过程,因此时空相关性建模是空气质量预测任务的关键。
[0003]大量的研究工作使得空气质量预测方法在近几十年取得了长远的发展。最为基础常用的方法是像Li和Zhang分别在2017和2019年提出的那样简单的合并异构数据源在单本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于多任务时空图卷积的空气质量预测方法,其特征在于,所述方法包括以下步骤:步骤1:获得站点空气质量监测数据集和细粒度的网格化气象数据集,构建POI数据集以及时间特征数据集,将数据集进行预处理并分为训练集、验证集和测试集,并将PM2.5作为目标污染物;步骤2:构建基于多任务时空图卷积的空气质量预测模型;步骤3:利用训练集对步骤2所述基于多任务时空图卷积的空气质量预测模型进行训练;步骤4:将测试集中站点的时空序列数据输入到步骤3中训练后的基于多任务时空图卷积的空气质量预测模型,输出未来γ步的空气质量预测值。2.根据权利要求1所述的方法,其特征在于,所述步骤1包括以下步骤:步骤1.1:在空气质量监测数据集中,对每个站点的历史监测数据利用线性插值和最大最小标准化方法进行预处理;步骤1.2:在网格化气象数据集中根据各个空气质量监测站点的经纬度将最近的气象监测站点数据作为该空气质量监测站点的气象数据,利用最大最小标准化方法进行预处理;步骤1.3:从路网数据集中提取各站点周围的兴趣点信息,将各类兴趣点技术作为POI特征,进行最大最小标准化预处理;步骤1.4:提取时间特征;步骤1.5:将预处理好的数据集,划分为训练集、验证集和测试集。3.根据权利要求1所述的方法,其特征在于,所述步骤2包括以下步骤:步骤2.1:对每个时间步利用记忆网络和注意力机制构建动态的空间关系图;步骤2.1.1:获得历史监测数据集中每个时间步的监测数据,将每个时间步的N个站点数据输入到特征重构模块,该特征重构模块是一个编码器

解码器结构,获得每个站点重构后的嵌入表示;步骤2.1.2:构建每个站点的长期记忆单元;并将步骤2.1.1中重构的嵌入表示与长期模式嵌入表示进行聚合操作,得到最终的各站点该时间步的嵌入表示;步骤2.1.3:根据步骤2.1.2得到的嵌入表示,利用注意力机制自适应得到成对站点间的影响权重构成每个时刻的空间关系图;步骤2.2:利用图卷积网络和图神经网络分别对空间关联性和时间关联性建模;步骤2.2.1:在每个时间步下,根据步骤2.1得到各个站点最终的嵌入表示以及N
×
N的邻接矩阵,进行拼接后输入到L层图卷积神经网络模块中,通过L层图卷积神经网络,聚合空间维度上的信息,得到每个站点融合K跳邻居后的嵌入表示;步骤2.2.2:根据步骤2.2.1的操作,最终得到一个T
×
N的嵌入表示矩阵,T为历史时间序列长度,将该嵌入表示矩阵输入到CNN卷积神经网络模块中,聚合时间维度上的嵌入表示,得到最终各站点融合时空信息后的表示向量;步骤2.3:利用多层的图神经网络构建站点的短期特征和长期模式,并利用多任务框架获得细粒度基于站点的预测任务和粗粒度基于城市的预测任务;步骤2.3.1:将步骤2.2.2得到的融合时空信息后的表示向量分别输入到长期CNN预测模块和短期CNN预测模块中,得到最终的细粒度站点级别的预测序列;
步骤2.3.2:将步骤2.2.2得到的融合时空信息后的表示向量输入到另一个长期CNN预测模块中,得到最终的粗粒度城市级别的预测序列。4.根据权利要求1所述的方法,其特征在于,所述步骤3包括以下步骤:步骤3.1:将训练集中的数据输入到自适应空间关系图模块,得到一个时间序列下每个时间步不同的空间关系图;步骤3.2:将步骤3.1得到的每个时间步不同的空间关系图输入到时空关系建模模块,得到各个站点每一时间步融合时空信息后的嵌入表示;步骤3.3:将步骤3.2各个站点时空特征嵌入表示输入到多任务空气质量预测模块,得到细粒度站点级别的预测结果和粗粒度城市级别的预测结果;步骤3.4:通过计算预测细粒度站点级别未来γ个时刻的PM2.5与真实PM2.5之间的误差来更新模型的参数以优化损失函数,训练得到最优的基于多任务时空图卷积的空气质量预测模型。5.根据权利要求3所述的方法,其特征在于,所述步骤2.1.1中的特征重构模块的输入是步骤1中各个站点的特征向量,为了使模型训练更稳定,通过一个自动编码器得到重构后的特征向量作为后续模型的输入,特征重构模块通过以下步骤构建:(1)构建一个编码器以原始特征向量作为输入,编...

【专利技术属性】
技术研发人员:韩启龙卢丹刘思宇宋洪涛
申请(专利权)人:北京电子工程总体研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1