空气污染物浓度时空域关联预测方法技术

技术编号:20623949 阅读:33 留言:0更新日期:2019-03-20 15:03
本发明专利技术涉及一种空气污染物浓度时空域关联预测方法,包括:步骤S1:以PM2.5为样例的目标污染物预测,构建基于残差网络和卷积LSTM网络预测模型;步骤S2:从环境监测数据中选择合适的训练和测试数据,完成对预测模型的初始化;步骤S3:对预测模型逐阶段进行训练,得到能够对PM2.5进行精确预测的神经网路预测模型;步骤S4:利用验证集选择模型的超参数(层数、节点数、学习率),直至模型最优;步骤S5:利用验证后的预测模型进行城市PM2.5预测。与现有技术相比,本发明专利技术使用卷积LSTM网络为中间层,实现对底层ResNet网络提取到的空间特征进行深层次时空关联特征提取,从而提升网络模型的预测性能,使用全连接层接收卷积LSTM的隐藏状态,产生最终的预测结果。

Spatio-temporal correlation prediction method for air pollutant concentration

The present invention relates to a spatial-temporal correlation prediction method for air pollutant concentration, which includes: (1) building a prediction model based on residual network and convolutional LSTM network with PM2.5 as an example for target pollutant prediction; (2) selecting appropriate training and testing data from environmental monitoring data to complete the initialization of prediction model; and (2) training the prediction model step by step. In practice, we can get the neural network prediction model which can accurately predict PM2.5; 4: use the validation set to select the super parameters (layers, nodes, learning rate) of the model until the model is optimal; 5: use the validated prediction model to predict urban PM2.5. Compared with the existing technology, the present invention uses convolutional LSTM network as the middle layer, realizes deep spatial and temporal correlation feature extraction of the spatial features extracted by the underlying ResNet network, thereby improving the prediction performance of the network model, receives the hidden state of convolutional LSTM using the full connection layer, and produces the final prediction results.

【技术实现步骤摘要】
空气污染物浓度时空域关联预测方法
本专利技术涉及一种城市空气污染物浓度预测方法,尤其是涉及一种空气污染物浓度时空域关联预测方法。
技术介绍
近年来,空气污染问题的日益严重引发了全世界的广泛关注。以PM2.5与PM10等污染物给人们的生活健康带来巨大的影响。空气污染问题日益突出,空气污染分析和预测具有复杂性和动态性,涉及多部门、多地区和多领域,对空气污染进行准确的预测,需要处理大量与之相关的环境数据和环境信息。各类机构重视并聚焦于空气污染的应对与处理能力的提升,其中空气污染预测技术是目前关注的焦点问题之一。目前,深度学习技术为代表的新型人工智能技术,为综合利用空气污染海量监测数据实现高精度预测提供了新的技术支撑。因此,如何借助深度学习技术,实现空气污染预测技术的性能提升,是目前环境污染现状下我们所要解决的一个问题。传统的空气污染物浓度预测技术主要以数值预测为关键手段,可以借助过往历史污染浓度数据实现对未来污染状态的预测分析。大多传统的空气污染物浓度数值预测模型,主要包括:基于假设理论和先验知识的确定性模型;基于数理统计的模型;基于小样本数据的传统机器学习的模型等。这些模型主要的优点在于计算复杂度低、计算速度快、易于实现。然而,面对空气污染数据维度高、影响因素多样性高、污染检测数据海量化等情况,传统数值分析模型遇到了以下关键难题:(1)分析模型采用的数据源过于单一,大多仅建立在污染数据单一集合上面,缺乏对其他环境因素,如天气数据的综合考虑;(2)在空间维度和时间维度上,传统模型缺乏对污染数据内部时空关联特征的挖掘能力,无法实现数据内部深层次联系提取和应对突变天气环境带来的影响;(3)模型的大规模数据运用能力有限,很难从大数据的角度挖掘出污染物的时空相关性。
技术实现思路
本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种空气污染物浓度时空域关联预测方法。本专利技术的目的可以通过以下技术方案来实现:一种空气污染物浓度时空域关联预测方法,包括:步骤S1:根据环境监测各类污染物浓度和气象因子的数据及时空分布特点,以PM2.5为样例的目标污染物预测,构建基于残差网络和卷积LSTM网络的预测模型;步骤S2:从环境监测数据中选择合适的训练和测试数据,完成对预测模型的初始化;步骤S3:对预测模型逐阶段进行训练,得到能够对PM2.5进行精确预测的神经网路预测模型;步骤S4:利用验证集选择模型的超参数,直至模型最优;步骤S5:利用验证后的预测模型进行城市PM2.5预测。所述预测模型包括:底层,由ResNet组成,用于压缩和提取输入数据空间关联特征,并以三维特征序列形式输出;高层,由ConvolutionalLSTM组成,用于基于三维特征序列产生最终预测序列。所述步骤S2中模型初始化过程包括:步骤S21:对选取的监测数据进行归一化的预处理,并将数据集按照70%,15%,15%的比例划分训练集、验证集和测试集;步骤S22:设置模型的误差阈值,将训练集的污染物数据和气象数据转化为二维矩阵输入模型。ResNet网络的卷积层数取为9层,卷积核的尺寸为3x3,ConvolutionalLSTM网络为单层,全连接层的每层神经元数量分别为256和64。对于ResNet网络,定义其训练阶段的损失函数为均方根误差函数:其中:RMSE为均方根误差函数,yi为污染物浓度的观测值,pi为污染物浓度的预测值,n为预测序列的长度;对于整个预测模型,定义其训练阶段的损失函数为:其中:为整个预测模型训练阶段的损失函数,λ为非负参数,ζ为控制L1,L2使用比例的参数,为网络中几种连接权值的集合。所述步骤S3具体包括:步骤S31:将被转化成二维矩阵的输入特征输入到ResNet中对ResNet进行训练,以ResNet网络训练阶段的损失函数衡量预测的准确性,直至误差小于设定阈值;步骤S32:基于训练集数据对整个预测模型进行训练。所述步骤S31中,ResNet网络训练阶段输入的二维矩阵中,包括以下因子:PM2.5浓度,温度,风速,风向,湿度,降水量,其他污染物浓度,站点。所述步骤S31中,ResNet的内部结构是以重构单元为单位对传统CNN重构,每一层的重构单元为三层的卷积层,每一个重构单元的输入为上一个重构单元的输入和输出的和,其中,输入和输出的和表示输入和输出特征图中每个对应通道的特征值相加过后得到的新的特征图。所述步骤S32中训练过程具体包括:步骤S321:ConvLSTM对ResNet输出的信息进行选择性遗忘;步骤S322:ConvLSTM选择输入信息中用来更新状态单元的的信息;步骤S323:将旧的单元状态更新为新的单元状态;步骤S324:基于新的单元状态确定输出信息输出提取的最终时空序列特征。与现有技术相比,本专利技术具有以下有益效果:1)RCL-Learning采用残差网络ResNet作为模型底层,实现多城市监测站点数据的空间特征提取,同时避免梯度消失或梯度爆炸问题,消除深层网络的退化问题。2)RCL-Learning在底层上方采用ConvolutionalLSTM,既通过ConvolutionalLSTM获得时间序列预测的性能优点,同时避免梯度消失问题,从而实现提取残差网络层输出的高维度数据中所隐含高层特征,达到挖掘数据时空相关性目标。3)RCL-Learning可同时应用多城市站点天气和污染多类别监测数据,满足环境监测大数据的综合利用,同时兼顾数据时空分布变化和分布规律,实现对目标城市空气污染物浓度预测。附图说明图1为本专利技术的主要步骤流程示意图;图2为本专利技术实施例中的流程示意图;图3为本专利技术的底层结构,用于提取数据空间特征;图4为本专利技术的中间层架构,用于提取数据时空特征;图5为本专利技术所构建的预测模型的结构示意图。具体实施方式下面结合附图和具体实施例对本专利技术进行详细说明。本实施例以本专利技术技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本专利技术的保护范围不限于下述的实施例。本申请首先对空气污染物浓度预测进行定义:定义1空气污染物浓度预测:主要是通过历史污染物和气象信息,对PM2.5、PM10等一系列空气污染在未来一定时间内的浓度进行预测,是环境科学、气象科学、计算机科学等都在重点研究的课题之一,因而具有一定的学科交叉性。定义2传统预测法:非深度学习的空气污染物浓度预测方法统称为传统的预测方法,大多传统的空气污染物浓度数值预测模型,主要包括:基于假设理论和先验知识的确定性模型;基于数理统计的模型;基于小样本数据的传统机器学习的模型等,均属于传统预测法。一种空气污染物浓度时空域关联预测方法,如图1和图2所示,包括:步骤S1:基于深度学习原理和ResNet及ConvolutionalLSTM网络的特点,根据环境监测各类污染物浓度和气象因子的数据,以PM2.5为预测的目标污染物,构建城市PM2.5浓度预测的模型,如图3和图4所示,模型以ResNet为底层,深层次提取输入数据空间关联特征;其结果作为高层ConvolutionalLSTM的输入,提取时空关联特征,并将该层网络的最终隐藏状态输入到全连接层产生预测结果;如图4所示,ResNet的预训练优先于整个模型的训练,并通过反向传播算法进行误差传递和网络连接权值的更新;将训练好的ResNet加入整本文档来自技高网
...

【技术保护点】
1.一种空气污染物浓度时空域关联预测方法,其特征在于,包括:步骤S1:根据环境监测各类污染物浓度和气象因子的数据及时空分布特点,以PM2.5为样例的目标污染物预测,构建基于残差网络和卷积LSTM网络的预测模型;步骤S2:从环境监测数据中选择合适的训练和测试数据,完成对预测模型的初始化;步骤S3:对预测模型逐阶段进行训练,得到能够对PM2.5进行精确预测的神经网路预测模型;步骤S4:利用验证集选择模型的超参数,直至模型最优;步骤S5:利用验证后的预测模型进行城市PM2.5预测。

【技术特征摘要】
1.一种空气污染物浓度时空域关联预测方法,其特征在于,包括:步骤S1:根据环境监测各类污染物浓度和气象因子的数据及时空分布特点,以PM2.5为样例的目标污染物预测,构建基于残差网络和卷积LSTM网络的预测模型;步骤S2:从环境监测数据中选择合适的训练和测试数据,完成对预测模型的初始化;步骤S3:对预测模型逐阶段进行训练,得到能够对PM2.5进行精确预测的神经网路预测模型;步骤S4:利用验证集选择模型的超参数,直至模型最优;步骤S5:利用验证后的预测模型进行城市PM2.5预测。2.根据权利要求1所述的一种空气污染物浓度时空域关联预测方法,其特征在于,所述预测模型包括:底层,由ResNet组成,用于压缩和提取输入数据空间关联特征,并以三维特征序列形式输出;高层,由ConvolutionalLSTM组成,用于基于三维特征序列产生最终预测序列。3.根据权利要求1所述的一种空气污染物浓度时空域关联预测方法,其特征在于,所述步骤S2中模型初始化过程包括:步骤S21:对选取的监测数据进行归一化的预处理,并将数据集按照70%,15%,15%的比例划分训练集、验证集和测试集;步骤S22:设置模型的误差阈值,将训练集的污染物数据和气象数据转化为二维矩阵输入模型。4.根据权利要求3所述的一种空气污染物浓度时空域关联预测方法,其特征在于,ResNet网络的卷积层数取为9层,卷积核的尺寸为3x3,ConvolutionalLSTM网络为单层,全连接层的每层神经元数量分别为256和64。5.根据权利要求4所述的一种空气污染物浓度时空域关联预测方法,其特征在于,对于ResNet网络,定义其训练阶段的损失函数为均方根误差函数:其中:RMSE为均方根误差函数...

【专利技术属性】
技术研发人员:张波邹国建李美子倪琴
申请(专利权)人:上海师范大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1