基于自适应主成分分析及神经网络的PM2.5浓度预测方法技术

技术编号:38203327 阅读:10 留言:0更新日期:2023-07-21 16:47
本发明专利技术提供了一种基于自适应主成分分析及神经网络的PM2.5浓度预测方法,包括:获取PM2.5浓度的影响因素历史数据并构造预测变量总样本;利用自适应主成分分析对每类影响因素提取预测因子,识别出有助于预测PM2.5日均浓度的影响因素;将降低维度后的影响因素输入神经网络混频数据模型,通过原始混频数据预测PM2.5日均浓度。本发明专利技术利用了sPCA准确地提取有用信息,降低了输入层的维数;运用了ANN

【技术实现步骤摘要】
基于自适应主成分分析及神经网络的PM2.5浓度预测方法


[0001]本专利技术涉及空气质量预测
,特别涉及一种基于自适应主成分分析及神经网络的PM2.5浓度预测方法。

技术介绍

[0002]伴随经济发展以及城市化进程的加速,各类污染物排放量的增加对大气环境造成了巨大影响,空气污染问题已经成为当今社会广泛关注的问题之一。PM2.5作为大气环境的主要污染物,对人群健康、交通出行、环境质量等都具有负面效应,因其具有传输距离长、停留时间久的特性,常被用来评定空气质量。因此,精确预测PM2.5日均浓度,对污染预报、预防呼吸道疾病以及大气环境治理有着至关重要的作用。
[0003]目前关于PM2.5日均浓度的预测方法主要有两类:一类是传统的统计学方法,另一类是深度学习的神经网络方法。在早期,对PM2.5日均浓度进行预测的方法主要采用灰色模型、线性回归、主成分回归等传统的统计学方法。虽然以上传统模型已经应用于污染物的预测之中,但这些模型大多是针对线性数据而设计的,对线性数据具有良好的预测效果,而PM2.5日均浓度的变化具有非线性、突变性等特点,是一种比较复杂的非线性系统,所以用传统的线性统计学方法对PM2.5浓度进行预测会产生较大误差。近些年随着神经网络在非线性问题领域表现越来越突出,越来越多地开始将神经网络作为污染物浓度的预测模型。但是单一预测模型的初始参数设置对预测的精度会产生很大的影响,为了提高模型的预测精度,越来越多地提出了混合模型,即根据单一的神经网络模型与其他的方法结合在一起的模型。虽然混合模型具有良好的预测效果,但需要通过反复试验来确定模型的参数,不仅费时费力,确定的参数也不一定最优。

技术实现思路

[0004]本专利技术的目的是:针对上述
技术介绍
中存在的不足,提供一种PM2.5浓度预测方法,通过自适应主成分分析(sPCA)能够准确地提取有用信息,可以识别出有助于预测PM2.5日均浓度的变量,降低输入层维度;通过神经网络混频数据模型(ANN

U

MIDAS)能够降低计算复杂度,避免数据同频化预处理的缺陷,同时能够在混频数据分析中准确识别变量间的非线性影响模式,来提高模型的拟合效果与预测能力。
[0005]为了达到上述目的,本专利技术提供了一种基于自适应主成分分析及神经网络的PM2.5浓度预测方法,包括:S1,获取PM2.5浓度的影响因素历史数据并构造预测变量总样本;S2,利用自适应主成分分析对每类影响因素提取预测因子,识别出有助于预测PM2.5日均浓度的影响因素,包括S21,形成一组缩放的预测变量,缩放系数是在标准化预测变量上进行预测回归的斜率;S22,从缩放的预测变量中提取扩散指数作为PM2.5日均浓度的预测因子;
S3,将降低维度后的影响因素输入神经网络混频数据模型,通过原始混频数据预测PM2.5日均浓度,包括S31,对每个预测变量进行频率对齐,以与输出变量具有相同频率;S32,将进入隐藏层的所有频率对齐向量与隐藏层权重相乘,再加上隐藏层偏差,在sigmoid传递函数的作用下,得到各隐藏层节点的计算结果;S33,将进入输入层的所有隐藏层节点的计算结果带入输出层,将进入输入层的所有隐藏层节点的计算结果与输出层权重相乘,再加上输出层偏差,在输出层传递函数的作用下,得到PM2.5日均浓度最终的输出结果:;其中,是输出层权重向量,是输出层偏差,是输出层传递函数。
[0006]进一步地,S1中影响因素包括SO2、NO2、CO、O3污染气体,最高温度、降水量、最低温度和风力,低频月度数据人均地区生产总值、人均地区工业企业总数、机动车辆数。
[0007]进一步地,S21中形成一组缩放的预测变量,缩放系数是在第i个标准化预测变量上进行预测回归的斜率,提取预测力强的变量对PM2.5日均浓度进行预测;;其中,N是潜在预测变量的总数量,表示PM2.5日均浓度从时间t到时间t+1的回归,是时间t的第i个预测变量,是均值等于零的误差值,表示第i个预测变量的截距项。
[0008]进一步地,S22从中提取扩散指数作为PM2.5日均浓度预测因子,所提取的扩散指数的形式为:;其中是K阶向量,表示自适应主成分分析的扩散指数,K由修正的确定,表示拟合优度,衡量的是预测值对于真实值的拟合好坏程度,是需要估计的K维参数,是异质噪声项。
[0009]进一步地,对每个预测变量的滞后值进行预测回归,通过缩放系数评估预测能力,缩放系数大的预测能力强,缩放系数小的预测能力弱,将预测能力强的预测变量作为神经网络混频数据模型的输入值。
[0010]进一步地,预测能力强的预测变量包括SO2、NO2、CO、风力、人均地区工业企业总数、机动车辆数。
[0011]进一步地,S31中对每个预测变量进行频率对齐,获得与输出变量具有相同频率的
;其中,是高频原始输入变量,是低频目标输出变量,表示和之间的频率不匹配,。
[0012]进一步地,S32中将进入隐藏层的所有频率对齐向量与隐藏层权重相乘,再加上隐藏层偏差,在sigmoid传递函数的作用下,得到各隐藏层节点的计算结果:;其中,是隐藏层的权重向量,是隐藏层的偏差向量,是与高频变量相关的高频预测范围,表示使用双曲正切函数的sigmoid传递函数。
[0013]本专利技术的上述方案有如下的有益效果:
[0014]本专利技术提供的基于自适应主成分分析及神经网络的PM2.5浓度预测方法,利用了自适应主成分分析(sPCA)对每类影响因素提取公因子,识别出有助于预测PM2.5日均浓度的影响因素,准确地提取有用信息,降低了输入层的维数;运用了神经网络混频数据模型(ANN

U

MIDAS)预测PM2.5日均浓度,该模型能够在人工神经网络中直接输入原始混频数据,避免了数据同频化预处理的缺陷,能够在混频数据分析中准确识别变量间的非线性影响模式,提高了模型的拟合效果与预测能力。
[0015]本专利技术的其它有益效果将在随后的具体实施方式部分予以详细说明。
附图说明
[0016]图1为本专利技术的步骤流程图。
具体实施方式
[0017]以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
[0018]需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自适应主成分分析及神经网络的PM2.5浓度预测方法,其特征在于,包括:S1,获取PM2.5浓度的影响因素历史数据并构造预测变量总样本;S2,利用自适应主成分分析对每类影响因素提取预测因子,识别出有助于预测PM2.5日均浓度的影响因素,包括S21,形成一组缩放的预测变量,缩放系数是在标准化预测变量上进行预测回归的斜率;S22,从缩放的预测变量中提取扩散指数作为PM2.5日均浓度的预测因子;S3,将降低维度后的影响因素输入神经网络混频数据模型,通过原始混频数据预测PM2.5日均浓度,包括S31,对每个预测变量进行频率对齐,以与输出变量具有相同频率;S32,将进入隐藏层的所有频率对齐向量与隐藏层权重相乘,再加上隐藏层偏差,在sigmoid传递函数的作用下,得到各隐藏层节点的计算结果;S33,将进入输入层的所有隐藏层节点的计算结果带入输出层,将进入输入层的所有隐藏层节点的计算结果与输出层权重相乘,再加上输出层偏差,在输出层传递函数的作用下,得到PM2.5日均浓度最终的输出结果:;其中,是输出层权重向量,是输出层偏差,是输出层传递函数。2.根据权利要求1所述的基于自适应主成分分析及神经网络的PM2.5浓度预测方法,其特征在于,S1中影响因素包括SO2、NO2、CO、O3污染气体,最高温度、降水量、最低温度和风力,低频月度数据人均地区生产总值、人均地区工业企业总数、机动车辆数。3.根据权利要求2所述的基于自适应主成分分析及神经网络的PM2.5浓度预测方法,其特征在于,S21中形成一组缩放的预测变量,缩放系数是在第i个标准化预测变量上进行预测回归的斜率,提取预测力强的变量对PM2.5日均浓度进行预测;;其中,N...

【专利技术属性】
技术研发人员:姚婷李振莹
申请(专利权)人:湖南工商大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1