【技术实现步骤摘要】
一种空气污染物浓度预报方法、装置及存储介质
本文涉及但不限于空气污染物浓度预报技术,尤其涉及一种空气污染物浓度预报方法、装置及存储介质。
技术介绍
通过空气质量监测站进行监测的方法是最常用的空气质量感知和空气污染情况观测的方法,其具有测量精度高、稳定性好等特点。但是我国的监测站点空间分布过于稀疏,很难为分析和研究提供有效而准确的数据。因此,针对现有的数据获取现状,要想对空气污染颗粒物进行有效地分析,采用合理的数据分析方法非常重要。一些技术中,针对空气污染物浓度的数据建模方法主要包括基于理论的方法以及基于统计的方法,这些方法能够依据历史空气污染物浓度监测数据对当前或未来某一时刻空气污染物浓度进行预报,然而均不能够对空气污染物的时间和空间动态特性进行整合利用,并且泛化能力及预报准确率一般。
技术实现思路
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。本申请实施例提供了一种空气污染物浓度预报方法,可以提高泛化能力及预测精度。本申请实施例提供了一种空气污染物浓度预报方法,包括:根据数据集构造训练集、验证集和测试集;所述数据集是通过收集目标地区预定时间长度内的污染物浓度数据和气象数据得到的;根据所述目标地区中监测站点的空间分布,构造图结构的邻接矩阵A;建立神经网络模型F(x;Θ|A),x为所述神经网络模型的输入数据,包括设定时间段内的所述污染物浓度数据和气象数据,利用所述训练集的数据对所述神经网络模型进行训练,利用所述验证集的数据和 ...
【技术保护点】
1.一种空气污染物浓度预报方法,其特征在于,包括:/n根据数据集构造训练集、验证集和测试集;所述数据集是通过收集目标地区预定时间长度内的污染物浓度数据和气象数据得到的;/n根据所述目标地区中监测站点的空间分布,构造图结构的邻接矩阵A;/n建立神经网络模型F(x;Θ|A),x为所述神经网络模型的输入数据,包括设定时间段内的所述污染物浓度数据和气象数据,利用所述训练集的数据对所述神经网络模型进行训练,利用所述验证集的数据和测试集的数据调整所述神经网络模型的参数Θ,获得修正后的神经网络模型;/n利用所述修正后的神经网络模型进行空气污染物浓度预报。/n
【技术特征摘要】
1.一种空气污染物浓度预报方法,其特征在于,包括:
根据数据集构造训练集、验证集和测试集;所述数据集是通过收集目标地区预定时间长度内的污染物浓度数据和气象数据得到的;
根据所述目标地区中监测站点的空间分布,构造图结构的邻接矩阵A;
建立神经网络模型F(x;Θ|A),x为所述神经网络模型的输入数据,包括设定时间段内的所述污染物浓度数据和气象数据,利用所述训练集的数据对所述神经网络模型进行训练,利用所述验证集的数据和测试集的数据调整所述神经网络模型的参数Θ,获得修正后的神经网络模型;
利用所述修正后的神经网络模型进行空气污染物浓度预报。
2.根据权利要求1所述的空气污染物浓度预报方法,其特征在于,所述根据所述数据集构造训练集、验证集和测试集,包括:
从所述数据集中读取污染物浓度数据和气象数据,其中,所述污染物浓度数据包括各个污染物浓度的值,所述气象数据包括各种气象条件的值;
根据预报需要的输入时间长度tin、输出时间长度tout,将所述数据集在时间维度上进行滑窗切片操作后获得多个数据片段,所述多个数据片段在时间维度上的长度均为t,所述多个数据片段的特征维度为各种气象条件的值以及各个污染物浓度的值,其中,t=tin+tout;
根据所述获得的多个数据片段构造训练集、验证集和测试集。
3.根据权利要求1所述的空气污染物浓度预报方法,其特征在于,所述利用所述训练集的数据对所述神经网络模型进行训练,包括:
将所述训练集中的数据(x,y)按批量送入所述神经网络模型进行训练,得到预测的输出计算损失函数基于梯度下降算法优化模型的参数Θ;
其中,y为污染物浓度数据;所述神经网络模型包括:输入层、隐藏层和输出层,所述隐藏层包括多个基于图卷积层和一维卷积层的自注意力模块。
4.根据权利要求1所述的空气污染物浓度预报方法,其特征在于,所述根据所述目标地区中监测站点的空间分布,构造图结构的邻接矩阵A,包括:
从所述数据集中读取所述监测站点的经度纬度坐标,转换为笛卡尔坐标系下的相对坐标,根据所述监测站点的两两间距离构造如下邻接矩阵:
其中,Aij为邻接矩阵的第i行第j列的元素,dij表示监测站点i与监测站点j之间的距离,σ为所有监测站点间距离的标准差,κ为预设的超参数,用于保证邻接矩阵稀疏性。
5.根据权利要求1-4中任一项所述的空气污染物浓度预报方法,其特征在于,所述神经网络模型的输入数据x在特征维度上进行过z-score标准化处理,以使所述输入数据x具有零均值和单位标准差,即
其中,上标(c)表示第c个特征维度,表示在第c个特征维度上进行过所述z-score标准化处理的输入数据x,μ表示数据点的平均值,σ表示所有监测站点间距离的标准差;
所述神经网络模型的输入数据x的构成张量的维度是N×T×G×C;
其中,N表示批量,T表示时间,G表示图节点,C表示特征维度。
6.根据权利要求3所述的空气污染物浓度预报方法,其特征在于,数据在所述隐藏层中按照如下顺序进行运算:
先进行时间自注意力运算,然后进行一次时间维度上的带门控线性激活的一维卷积运算,一次图节点自注意力运算,一次图节点维度带残差连接的一阶Chebyshev图卷积运算,一次时间维度上带残差连接的一维卷积运算;
其中,上述运算中,将顺序在先的运算结果数据作为下一运算的输入数据进行运算。
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。