一种空气质量指数的预测方法技术

技术编号:33796137 阅读:13 留言:0更新日期:2022-06-16 09:59
本发明专利技术涉及空气污染预测技术领域,尤其涉及一种空气质量指数的预测方法,包括以下步骤:构造网络数据;构建空气质量指数预测模型,空气质量指数预测模型包括基于注意力的图卷积网络和长短期记忆神经网络;训练空气质量指数预测模型;利用训练好的空气质量指数预测模型对空气质量指数进行预测。本发明专利技术提出的一种空气质量指数的预测方法,解决了现有的预测方法的准确率不高的问题。法的准确率不高的问题。法的准确率不高的问题。

【技术实现步骤摘要】
一种空气质量指数的预测方法


[0001]本专利技术涉及空气污染预测
,尤其涉及一种空气质量指数的预测方法。

技术介绍

[0002]空气质量指数(Air Quality Index,简称AQI),是一个用来定量描述空气质量水平的数值。大气污染能够通过空气质量指数很直接的表现出来,大气污染有地域性和时间性两方面的因素影响,通常来讲就是具有时空性质。
[0003]现有的大气污染物的预测技术只针对时间特征和空间特征,没有同时考虑两方面的影响。使用时间特征是一种传统的、利用空气质量指数这种对时间敏感数据的特性,预测空气质量指数,但是现有的模型对时间序列的处理已经到达了瓶颈阶段,无法进一步提升预测准确率。
[0004]只使用空间特征,是考虑当前站点和其他站点的相互影响,而忽略了大气数据的时序性,而且现阶段的空间特征的使用往往只局限于邻居节点的学习,而没有像人学习思维一样,有学习注意力的特性,让模型学得邻居节点的权值。

技术实现思路

[0005]本专利技术提出一种空气质量指数的预测方法,以解决现有的预测方法的准确率不高的问题。
[0006]本专利技术解决上述问题的技术方案是:一种空气质量指数的预测方法,包括以下步骤:
[0007]构造网络数据,其中,所述网络数据包括空气监测站点之间的邻接矩阵和各个空气监测站点的特征矩阵;
[0008]构建空气质量指数预测模型,所述空气质量指数预测模型包括基于注意力的图卷积网络和长短期记忆神经网络;
[0009]训练空气质量指数预测模型
[0010]将所述网络数据输入至空气质量指数预测模型,基于损失函数对所述空气质量指数预测模型中进行训练,直至所述空气质量指数预测模型收敛;
[0011]利用训练好的空气质量指数预测模型对空气质量指数进行预测。
[0012]优选的是,所述构造网络数据的步骤具体包括:
[0013]获取多个空气监测站点的大气历史数据以及各个空气监测站点之间的距离,其中所述大气历史数据包括各项污染物空气质量分指数的历史数据和气象历史数据;
[0014]根据各个空气监测站点之间的距离构造空气监测站点之间的邻接矩阵;
[0015]对大气历史数据进行预处理得到各个空气监测站点的特征矩阵;
[0016]将所述大气历史数据划分为训练集、验证集和测试集。
[0017]优选的是,预处理方法包括均值填充空值,去除异常数据,平滑数据。
[0018]优选的是,所述训练集、验证集和测试集的占比分别为70%、15%和15%。
[0019]优选的是,所述根据各个空气监测站点之间的距离构造空气监测站点之间的邻接矩阵的步骤包括:设置阈值k=1500km,大于k的为0,小于k的设置为1来构造邻接矩阵。
[0020]优选的是,所述训练训练空气质量指数预测模型具体包括:
[0021]将空气监测站点之间的邻接矩阵和训练集的特征矩阵输入至基于注意力的图卷积网络中,得到大气特征矩阵;
[0022]采用多步多变量法重构大气特征矩阵,得到构造后的大气特征数据;
[0023]将构造后的大气特征数据输入至长短期记忆神经网络层进行训练;
[0024]设计损失函数;
[0025]基于损失函数对所述空气质量指数预测模型中进行训练,直至模型收敛。
[0026]优选的是,所述损失函数表示为
[0027][0028]其中,O
i
为第i条大气特征数据的真实值,P
i
为第i条大气特征数据的预测值,N为总的数据个数。
[0029]优选的是,所述利用训练好的空气质量指数预测模型对空气质量指数进行预测的步骤具体包括将测试集输入至训练好的空气质量指数预测模型得到空气质量指数。
[0030]相比于现有技术,本专利技术的有益效果在于:本专利技术的预测模型包括基于注意力机制的图卷积网络和长短期记忆网络,使用图注意力卷积网络层用于各个监测站点空间特征的提取,使用长短期记忆网络层对各个站点的时间特征进行处理,构建融合两种网络层的端到端的网络模型,将两种数据特征融合训练,不仅能够为模型预测提供更加丰富的特征信息,能够提高模型的泛化能力,最终使得当前站点的预测准确率大大提高。本专利技术为了将两个神经网络层数据流通,设计了中间层数据组合方式,使各个模型层可以梯度传播。
附图说明
[0031]图1为本专利技术预测方法的流程示意图。
[0032]图2为空气质量指数预测模型的结构示意图。
具体实施方式
[0033]为使本专利技术实施方式的目的、技术方案和优点更加清楚,下面将结合本专利技术实施方式中的附图,对本专利技术实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本专利技术一部分实施方式,而不是全部的实施方式。基于本专利技术中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本专利技术保护的范围。因此,以下对在附图中提供的本专利技术的实施方式的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施方式。
[0034]实施例1:如图1所示的一种空气质量指数的预测方法,具体步骤包括:
[0035]S1:构造网络数据
[0036]根据站点(空气监测站点)的经纬度计算各个站点的欧式距离,设置阈值k=1500km,构造站点之间的邻接矩阵A,大于k的为0,小于k的设置为1。
[0037]对每个站点的大气历史数据进行预处理,包括使用均值填充空值,去除异常数据,
平滑数据等,得到各个站点的特征矩阵X。
[0038]将站点大气历史数据划分为训练集、验证集和测试集。
[0039]S2:构建空气质量指数预测模型(GA

LSTM),输入S1提供的数据,经过网络模型训练,得到训练好的模型。
[0040]S21:分别将站点邻接矩阵A和训练集的大气特征矩阵X放入注意力的图卷积网络中进行前向传播,通过站点邻接矩阵关系,学习相邻站点的特性,修正特征数据,得到大气特征矩阵相当于利用站点的空间信息。计算公式如下
[0041][0042]其中:i为当前节点,j为当前计算的相邻的节点,α
ijk
为k个注意力机制计算后的线性化注意力相关值,W
k
为权重矩阵,K为多个头的图注意力层,σ为非线性层。
[0043]S22:将大气特征矩阵,根据长短期记忆神经网络层的特性,使用多步多变量的方法,按照利用多天多元特征预测未来几天的形式,重新构造数据矩阵得到构造后的大气特征数据,由此构成长短期记忆网络特性的数据格式。
[0044]多步多变量的方法:利用前n天的大气数据的空气质量指数构成一条训练数据的特征,n+t天的空气质量指标值构成当前训练数据的标记。例如:用1月1日

14日的大气数据和空气质量指数作为特征,预测1月15日

21日的空气质量指数,即利用前14天数据预测未来7本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种空气质量指数的预测方法,其特征在于,包括以下步骤:构造网络数据,其中,所述网络数据包括空气监测站点之间的邻接矩阵和各个空气监测站点的特征矩阵;构建空气质量指数预测模型,所述空气质量指数预测模型包括基于注意力的图卷积网络和长短期记忆神经网络;训练空气质量指数预测模型将所述网络数据输入至空气质量指数预测模型,基于损失函数对所述空气质量指数预测模型中进行训练,直至所述空气质量指数预测模型收敛;利用训练好的空气质量指数预测模型对空气质量指数进行预测。2.根据权利要求1所述的一种空气质量指数的预测方法,其特征在于,所述构造网络数据的步骤具体包括:获取多个空气监测站点的大气历史数据以及各个空气监测站点之间的距离,其中所述大气历史数据包括各项污染物空气质量分指数的历史数据和气象历史数据;根据各个空气监测站点之间的距离构造空气监测站点之间的邻接矩阵;对大气历史数据进行预处理得到各个空气监测站点的特征矩阵;将所述大气历史数据划分为训练集、验证集和测试集。3.根据权利要求2所述的一种空气质量指数的预测方法,其特征在于,预处理方法包括均值填充空值,去除异常数据,平滑数据。4.根据权利要求3所述的一种空气质量指数的预测方法,其特征在于,所述训练集、验证集和测试集的占比分别为70%、15%...

【专利技术属性】
技术研发人员:尚鹏王博侯增涛付威廉张笑千杨德龙
申请(专利权)人:中国科学院深圳先进技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1