当前位置: 首页 > 专利查询>清华大学专利>正文

一种空气污染物浓度预报方法、装置及存储介质制造方法及图纸

技术编号:28376692 阅读:24 留言:0更新日期:2021-05-08 00:04
一种空气污染物浓度预报方法、装置及存储介质,所述方法包括:根据数据集构造训练集、验证集和测试集;数据集是通过收集目标地区预定时间长度内的污染物浓度数据和气象数据得到的;根据目标地区中监测站点的空间分布,构造图结构的邻接矩阵A;建立神经网络模型F(x;Θ|A),x为神经网络模型的输入数据,包括设定时间段内的所述污染物浓度数据和气象数据,利用训练集的数据对神经网络模型进行训练,利用验证集的数据和测试集的数据调整神经网络模型的参数Θ,获得修正后的神经网络模型;利用修正后的神经网络模型进行空气污染物浓度预报。

【技术实现步骤摘要】
一种空气污染物浓度预报方法、装置及存储介质
本文涉及但不限于空气污染物浓度预报技术,尤其涉及一种空气污染物浓度预报方法、装置及存储介质。
技术介绍
通过空气质量监测站进行监测的方法是最常用的空气质量感知和空气污染情况观测的方法,其具有测量精度高、稳定性好等特点。但是我国的监测站点空间分布过于稀疏,很难为分析和研究提供有效而准确的数据。因此,针对现有的数据获取现状,要想对空气污染颗粒物进行有效地分析,采用合理的数据分析方法非常重要。一些技术中,针对空气污染物浓度的数据建模方法主要包括基于理论的方法以及基于统计的方法,这些方法能够依据历史空气污染物浓度监测数据对当前或未来某一时刻空气污染物浓度进行预报,然而均不能够对空气污染物的时间和空间动态特性进行整合利用,并且泛化能力及预报准确率一般。
技术实现思路
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。本申请实施例提供了一种空气污染物浓度预报方法,可以提高泛化能力及预测精度。本申请实施例提供了一种空气污染物浓度预报方法,包括:根据数据集构造训练集、验证集和测试集;所述数据集是通过收集目标地区预定时间长度内的污染物浓度数据和气象数据得到的;根据所述目标地区中监测站点的空间分布,构造图结构的邻接矩阵A;建立神经网络模型F(x;Θ|A),x为所述神经网络模型的输入数据,包括设定时间段内的所述污染物浓度数据和气象数据,利用所述训练集的数据对所述神经网络模型进行训练,利用所述验证集的数据和测试集的数据调整所述神经网络模型的参数Θ,获得修正后的神经网络模型;利用所述修正后的神经网络模型进行空气污染物浓度预报。本申请实施例还提供了一种空气污染物浓度预报装置,包括存储器和处理器,所述存储器用于保存进行空气污染物浓度预报的程序;所述处理器用于读取所述进行空气污染物浓度预报的程序,并执行如上所述的空气污染物浓度预报方法。本申请实施例还提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行如上所述的空气污染物浓度预报方法。本申请实施例采用基于图神经网络的空气污染物浓度预报方法,对空气污染物的时间和空间动态特性进行整合利用,不仅能够更加有效地捕捉更大范围地区的空气污染物浓度变化情况,还提高了预测的效率和准确度,同时具有较高的泛化能力,便于实际应用。本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的其他优点可通过在说明书以及附图中所描述的方案来实现和获得。在阅读并理解了附图和详细描述后,可以明白其他方面。附图说明附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。图1为本申请实施例中空气污染物浓度预报方法的流程图;图2为本申请实施例中神经网络模型的示意图;图3为本申请实施例中空气污染物浓度预报装置的示意图;图4为本申请实施例中又一实现形式的空气污染物浓度预报装置的示意图。具体实施方式本申请描述了多个实施例,但是该描述是示例性的,而不是限制性的,并且对于本领域的普通技术人员来说显而易见的是,在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合,并在具体实施方式中进行了讨论,但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外,任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用,或可以替代任何其它实施例中的任何其他特征或元件。本申请包括并设想了与本领域普通技术人员已知的特征和元件的组合。本申请已经公开的实施例、特征和元件也可以与任何常规特征或元件组合,以形成由权利要求限定的独特的专利技术方案。任何实施例的任何特征或元件也可以与来自其它专利技术方案的特征或元件组合,以形成另一个由权利要求限定的独特的专利技术方案。因此,应当理解,在本申请中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此,除了根据所附权利要求及其等同替换所做的限制以外,实施例不受其它限制。此外,可以在所附权利要求的保护范围内进行各种修改和改变。此外,在描述具有代表性的实施例时,说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而,在该方法或过程不依赖于本文所述步骤的特定顺序的程度上,该方法或过程不应限于所述的特定顺序的步骤。如本领域普通技术人员将理解的,其它的步骤顺序也是可能的。因此,说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外,针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤,本领域技术人员可以容易地理解,这些顺序可以变化,并且仍然保持在本申请实施例的精神和范围内。如
技术介绍
中所说的,一些技术中针对空气污染物浓度的数据建模方法主要包括基于理论的方法以及基于统计的方法,本申请专利技术人在实践中敏锐的发现这些方法存在以下问题:基于理论的方法又称数值预报,是现代天气预报的常用技术之一。这类方法一般以大气动力学理论为基础,对空气污染物颗粒的分子在大气中的反应以及扩散进行模拟,通过数值计算的方法给出对空气污染物浓度的模拟。这类方法可以较好地给出大气的运动情况,对气象现象的解释性较好。然而,由于气象系统的变化具有极强的非线性和时变特性,基于大气动力学理论的建模对短时间快速变化的动态建模效果不佳,往往在实践中需要采用多个系统联合预报的方式来增强预报的准确度和稳定性。基于统计方法的预报算法,如:整合移动平均自回归模型(ARIMA)、支持向量机回归(SVR)和深度神经网络等方法,能够在各种场景下使用,由于基于统计的方法抛弃了复杂的机理建模,具有快速、简单、计算量少的特点,适合分析短期时间的变化趋势。然而,上述这些方法并不能够对空气污染物的时间和空间动态特性进行整合利用,并且泛化能力不强,预报的准确率不高。如图1所示,本申请实施例提供了一种空气污染物浓度预报方法,包括:S100:根据数据集构造训练集、验证集和测试集;数据集是通过收集目标地区预定时间长度内的污染物浓度数据和气象数据得到的;S101:根据目标地区中监测站点的空间分布,构造图结构的邻接矩阵A;S102:建立神经网络模型F(x;Θ|A),x为神经网络模型的输入数据,包括设定时间段内的污染物浓度数据和气象数据,利用训练集的数据对神经网络模型进行训练,利用验证集的数据和测试集的数据调整神经网络模型的参数Θ,获得修正后的神经网络模型;S103:利用修正后的神经网络模型进行空气污染物浓度预报。在执行步骤S100时,可以根据需求选择任意目标地区,如以省、市、县等为单位进行选择,也可以只选定某一片区域,不限于某行政划界,本申请实施例对此不作限制。在选定目标地区后,收集该目标地区在预定时间长度内的污染物浓度数据和气象本文档来自技高网
...

【技术保护点】
1.一种空气污染物浓度预报方法,其特征在于,包括:/n根据数据集构造训练集、验证集和测试集;所述数据集是通过收集目标地区预定时间长度内的污染物浓度数据和气象数据得到的;/n根据所述目标地区中监测站点的空间分布,构造图结构的邻接矩阵A;/n建立神经网络模型F(x;Θ|A),x为所述神经网络模型的输入数据,包括设定时间段内的所述污染物浓度数据和气象数据,利用所述训练集的数据对所述神经网络模型进行训练,利用所述验证集的数据和测试集的数据调整所述神经网络模型的参数Θ,获得修正后的神经网络模型;/n利用所述修正后的神经网络模型进行空气污染物浓度预报。/n

【技术特征摘要】
1.一种空气污染物浓度预报方法,其特征在于,包括:
根据数据集构造训练集、验证集和测试集;所述数据集是通过收集目标地区预定时间长度内的污染物浓度数据和气象数据得到的;
根据所述目标地区中监测站点的空间分布,构造图结构的邻接矩阵A;
建立神经网络模型F(x;Θ|A),x为所述神经网络模型的输入数据,包括设定时间段内的所述污染物浓度数据和气象数据,利用所述训练集的数据对所述神经网络模型进行训练,利用所述验证集的数据和测试集的数据调整所述神经网络模型的参数Θ,获得修正后的神经网络模型;
利用所述修正后的神经网络模型进行空气污染物浓度预报。


2.根据权利要求1所述的空气污染物浓度预报方法,其特征在于,所述根据所述数据集构造训练集、验证集和测试集,包括:
从所述数据集中读取污染物浓度数据和气象数据,其中,所述污染物浓度数据包括各个污染物浓度的值,所述气象数据包括各种气象条件的值;
根据预报需要的输入时间长度tin、输出时间长度tout,将所述数据集在时间维度上进行滑窗切片操作后获得多个数据片段,所述多个数据片段在时间维度上的长度均为t,所述多个数据片段的特征维度为各种气象条件的值以及各个污染物浓度的值,其中,t=tin+tout;
根据所述获得的多个数据片段构造训练集、验证集和测试集。


3.根据权利要求1所述的空气污染物浓度预报方法,其特征在于,所述利用所述训练集的数据对所述神经网络模型进行训练,包括:
将所述训练集中的数据(x,y)按批量送入所述神经网络模型进行训练,得到预测的输出计算损失函数基于梯度下降算法优化模型的参数Θ;
其中,y为污染物浓度数据;所述神经网络模型包括:输入层、隐藏层和输出层,所述隐藏层包括多个基于图卷积层和一维卷积层的自注意力模块。


4.根据权利要求1所述的空气污染物浓度预报方法,其特征在于,所述根据所述目标地区中监测站点的空间分布,构造图结构的邻接矩阵A,包括:
从所述数据集中读取所述监测站点的经度纬度坐标,转换为笛卡尔坐标系下的相对坐标,根据所述监测站点的两两间距离构造如下邻接矩阵:



其中,Aij为邻接矩阵的第i行第j列的元素,dij表示监测站点i与监测站点j之间的距离,σ为所有监测站点间距离的标准差,κ为预设的超参数,用于保证邻接矩阵稀疏性。


5.根据权利要求1-4中任一项所述的空气污染物浓度预报方法,其特征在于,所述神经网络模型的输入数据x在特征维度上进行过z-score标准化处理,以使所述输入数据x具有零均值和单位标准差,即



其中,上标(c)表示第c个特征维度,表示在第c个特征维度上进行过所述z-score标准化处理的输入数据x,μ表示数据点的平均值,σ表示所有监测站点间距离的标准差;
所述神经网络模型的输入数据x的构成张量的维度是N×T×G×C;
其中,N表示批量,T表示时间,G表示图节点,C表示特征维度。


6.根据权利要求3所述的空气污染物浓度预报方法,其特征在于,数据在所述隐藏层中按照如下顺序进行运算:
先进行时间自注意力运算,然后进行一次时间维度上的带门控线性激活的一维卷积运算,一次图节点自注意力运算,一次图节点维度带残差连接的一阶Chebyshev图卷积运算,一次时间维度上带残差连接的一维卷积运算;
其中,上述运算中,将顺序在先的运算结果数据作为下一运算的输入数据进行运算。

【专利技术属性】
技术研发人员:黄高夏卓凡宋士吉
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1