【技术实现步骤摘要】
基于特征扩张的融合神经网络的城市PM10浓度预测方法
本专利技术涉及一种PM10浓度预测方法,尤其是涉及一种基于特征扩张的融合神经网络的城市PM10浓度预测方法。
技术介绍
空气污染是日常生活中被广泛关注的问题,并且随着空气污染问题日益严重,空气污染物的种类日益繁多,空气污染物的形成和扩散的方也式愈加复杂,污染物浓度的预测不再是单点性的,而是具有动态的、区域联动性的。所以在当前形式下,为了做出更为精确的污染物浓度预测,预防重污染事件的发生,提升环境管理和决策水平,应充分利用监测到的污染物和气象大数据,充分挖掘和学习数据特征,并且充分考虑污染物浓度的关联性。空气污染物浓度预测是学术界研究的热点问题之一,目前的研究成果包括以唐晓等为代表的基于数值统计的方法,建立目标污染物浓度与其他污染物浓度之间的关系;MDong等为代表的基于概率分布的方法,将时间因素加入了模型训练,运用半隐马尔科夫法为不同浓度级别的PM2.5都训练出对应的模型;Balachandran等为代表的基于传统机器学习的方法,以历史的气象和污染物浓度数据为训练集和测试集,以BP神经网络为预测模型,建立空气污染物浓度预测体系。这些方法在以往环境形势简单,数据规模较小的情况下,发挥了长足的优势,然而在面临着海量污染物数据和气象数据的情况下,这些方法缺乏对数据特征的深度分析,无法充分学习数据特征,挖掘数据联系,同时,这些方法将污染物浓度变化视为离散型事件,不考虑且不能进行时间和空间上的关联分析,从而无法进行精确的污染物浓度预测。另一方面,考虑到用于空气污染物浓度预测的完备数据集较难获得,大部分存在特征缺失 ...
【技术保护点】
1.一种基于特征扩张的融合神经网络的城市PM10浓度预测方法,其特征在于,包括:步骤S1:基于特征扩张的栈式自编码器和LSTM网络,构建城市PM10浓度预测的模型;步骤S2:针对所构建的模型,从污染物和气象的监测数据中选择训练数据和测试数据;步骤S3:利用训练数据对基于特征扩张的栈式自编码器进行训练;步骤S4:基于高斯函数对栈式自编码器的输出的特征向量进行处理,为不同城市的特征向量计算相应的影响权重,加权求和得到新的特征向量;步骤S5:将所述新的特征向量输入到LSTM中,进行模型的整体训练;步骤S6:将测试数据输入训练好的模型,衡量测试数据产生的预测结果的误差,若误差超过阈值,则返回步骤S2,反之,则执行步骤S7;步骤S7:将训练和微调好的模型用于空气污染物浓度预测。
【技术特征摘要】
1.一种基于特征扩张的融合神经网络的城市PM10浓度预测方法,其特征在于,包括:步骤S1:基于特征扩张的栈式自编码器和LSTM网络,构建城市PM10浓度预测的模型;步骤S2:针对所构建的模型,从污染物和气象的监测数据中选择训练数据和测试数据;步骤S3:利用训练数据对基于特征扩张的栈式自编码器进行训练;步骤S4:基于高斯函数对栈式自编码器的输出的特征向量进行处理,为不同城市的特征向量计算相应的影响权重,加权求和得到新的特征向量;步骤S5:将所述新的特征向量输入到LSTM中,进行模型的整体训练;步骤S6:将测试数据输入训练好的模型,衡量测试数据产生的预测结果的误差,若误差超过阈值,则返回步骤S2,反之,则执行步骤S7;步骤S7:将训练和微调好的模型用于空气污染物浓度预测。2.根据权利要求1所述的一种基于特征扩张的融合神经网络的城市PM10浓度预测方法,其特征在于,所述模型包括:基于特征扩张的栈式自编码器,用于接收输入数据,进行特征维度扩充,挖掘和提取输入数据的重要特征;基于高斯函数的中间过程处理模块,用于为栈式自编码器的各项输出计算相应的影响权重,并将其与原输出加权求和形成新的输出;LSTM网络:用于接收栈式自编码器和中间过程处理模块处理后产生的新的输出,提取时间序列特征,产生最终预测结果。3.根据权利要求1所述的一种基于特征扩张的融合神经网络的城市PM10浓度预测方法,其特征在于,所述基于特征扩张的栈式自编码器,设有有3层自编码器,每层的节点数分别为64、128和256;所述LSTM网络为单层,神经元数量为128个。4.根据权利要求1所述的一种基于特征扩张的融合神经网络的城市PM10浓度预测方法,其特征在于,所述步骤S2具体包括:步骤S21:按照设定比例从污染物和气象的监测数据中选取训练数据和测试数据,并对选取的数据进行归一化的预处理,归一化处理后的数据为:其中:x'为归一化处理后的数据,μ为原始数据均值,σ为原始数据标准差,x为归一化处理前的数据;步骤S22:设置模型的误差阈值,将输入的训练数据的污染物数据和气象数据转化为二维矩阵,其中,矩阵的每一行为一个站点的各污染物信息和气象信息,每一列为指定的污染物信息或者指定的气象信息;步骤S23:将输入特征从二维矩阵拉平成用于输入到栈式自编码器中的一维向量。5.根据权利要求4所述的一种基于特征扩张的融合神经网络的城市PM10浓度预测方法,其特征在于,所述步骤S3具体包括:步骤S31:将被拉平成一维向量的多个城市的输入特征输入到栈式自编码器,以单独对栈式自编码器进行训练;步骤S32:栈式自编码器通过逐渐增加每层的节点数实现对输入特征的维度扩充,挖掘特征信息,并将训练之后产生的参数值和...
【专利技术属性】
技术研发人员:张波,雍睿涵,李美子,倪琴,
申请(专利权)人:上海师范大学,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。