一种基于非线性理论的PM2.5预测与预警方法及系统技术方案

技术编号:18862118 阅读:24 留言:0更新日期:2018-09-05 14:54
本发明专利技术公开了一种基于非线性理论的PM2.5预测与预警方法及系统,模型训练步骤和模型预测步骤;针对PM2.5浓度时序数据分为两组,分别作为训练时序数据集及测试时序训练集;对所述训练时序数据集的数据进行S级小波分解,进行时频分析,将一维信息扩展为高维信息,提取PM2.5历史数据的隐含信息,得到训练时序指标数据集;构造预测模型;对预测模型进行训练;针对测试时序训练集,进行MLRC‑LSSVR模型预测,对模型预测结果做方差分析,得到置信区间的上界值作为最终的预测结果。本发明专利技术能够提供模型的可调参数,通过改变可调参数从而适应不同地区PM2.5浓度的预测预警工作。

A PM2.5 prediction and early warning method and system based on nonlinear theory

The invention discloses a PM2.5 prediction and early warning method and system based on nonlinear theory, a model training step and a model prediction step; divides the PM2.5 concentration time series data into two groups, which are the training time series data set and the test time series training set respectively; carries out S-level wavelet decomposition on the training time series data set, and advances. Line time-frequency analysis expands one-dimensional information into high-dimensional information, extracts the implicit information of PM2.5 historical data, and obtains the training time series index data set; constructs the prediction model; trains the prediction model; carries on the MLRC_LSSVR model forecast for the test time series training set, makes the variance analysis to the model forecast result, obtains the confidence. The upper bound value of the interval is taken as the final prediction result. The invention can provide the adjustable parameters of the model and adapt to the prediction and early warning work of PM2.5 concentration in different areas by changing the adjustable parameters.

【技术实现步骤摘要】
一种基于非线性理论的PM2.5预测与预警方法及系统
本专利技术涉及空气质量预测与预警领域,特别是涉及一种基于非线性理论的PM2.5预测与预警方法及系统。
技术介绍
雾霾的主要成分就是PM2.5,PM2.5是粒径小于2.5μm的颗粒物,是一种胶体混合物。PM2.5的影响因素复杂,其浓度变化呈现出非线性特征。目前大气污染物浓度预测方法主要有统计模型和确定性模型两类。其中,统计模型一般是基于历史数据建立空气质量与影响因素之间的关联模型,其优点在于对输入数据要求相对较低,但预测精度较低,难以反映区域空气质量且无法对污染成因以及来源等给出合理解释;数值模型则是依据不同尺度大气动力学理论,耦合大气物理和化学变化过程,建立多尺度类型大气污染物扩散模型,依靠计算机系统预报大气污染物浓度变化趋势和动态分布情况,其优点是能够对污染成因进行诊断,计算精确,能够对区域内大气污染物浓度进行预测,其局限性在于时效性污染排放数据获取困难,模型对数据要求高,实际操作困难较大。鉴于数值预报所需成本消耗较高,存在较多的不确定因素,模型建立过程和数据需求要求较复杂,众多的研究倾向于以统计模型为主要手段开展大气污染物浓度预测,特别是针对单站点统计模型预报开展了大量的改进研究。很多研究者将传统的统计学方法与神经网络模型、自回归移动平均模型、多元线性回归模型相结合获得了较为理想的预测结果。而从方法学的角度来看,自回归移动平均模型和多元线性回归模型均是线性模式,某些非线性的关系很难被精确预测,这种缺陷已在某些实例研究中体现出来;神经网络模型作为一种非线性映射方法,其多层感知模式使得神经网络模型在细微颗粒物浓度预测方面有良好的效果。但神经网络方法的学习速度通常比较慢,参数设定困难,并且容易陷入局部最优,推广能力差,而且预测效率较低。支持向量机(SVM)的出现克服了神经网络训练时间长、泛化能力差、易陷入局部极小等缺点。单步预测效果良好,但是在进行多步预测时,每步预测都需要上次预测的输出作为输入,在这种迭代的过程中,上一次的预测结果会影响在接下来时间点的预测结果,误差也就会逐步积累直到最后,预测效果逐步减弱。综上所述,现有技术中对于PM2.5的预测问题,尚缺乏有效的解决方案。
技术实现思路
为了解决现有技术的不足,本专利技术提供了一种基于非线性理论的PM2.5预测与预警方法,该方法能够提供模型的可调参数,通过改变可调参数从而适应不同地区PM2.5浓度的预测预警工作。一种基于非线性理论的PM2.5预测与预警方法,包括:模型训练步骤和模型预测步骤;针对PM2.5浓度时序数据分为两组,分别作为训练时序数据集及测试时序训练集;对所述训练时序数据集的数据进行S级小波分解,进行时频分析,将一维信息扩展为高维信息,提取PM2.5历史数据的隐含信息,得到训练时序指标数据集;然后构造基于多级残差修正的非线性最小二乘支持向量回归(AMLRC-LSSVR)的预测模型;对AMLRC-LSSVR模型进行训练;针对测试时序训练集,进行MLRC-LSSVR模型预测,对模型预测结果做方差分析,得到置信区间的上界值作为最终的预测结果。进一步的,所述预测模型可调参数为:小波分解层数s,最小二乘支持向量机回归的参数,包括核函数参数以及正则化参数γ,可通过遗传算法等方法来寻优获得。进一步的,基于多级残差修正的非线性最小二乘支持向量回归(MLRC-LSSVR)预测模型描述如下:训练输入:训练数据集(Xtrain,Ytrain)∈R(n-1)×2,其中,预测输出:n+1时刻PM2.5污染物的预测浓度进一步的,所述模型训练步骤:步骤1:对训练数据集中Xtrain进行coifN小波变换,得到m层高维输入训练矩阵X′train={X′train,1,X′train,2,...X′train,n-1},其中,i=1,2,...n-1,构造LSSVR模型训练数据集(X′rain,Ytrain)∈R(n-1)×(m+2);步骤2:基于训练数据集(X′train,Ytrain)对LSSVR模型进行训练,训练过程采用搜索效率较高的simplex方法和10折交叉验证,优化搜索LSSVR的高斯核函数关键参数,并得到LSSVR训练终值Y′train;步骤3:计算LSSVR训练终值Y′train与Ytrain之间的R2相关系数R2(Y′train,Ytrain);步骤4:如果R2相关系数R2(Y′train,Ytrain)小于预设的R2相关系数阈值,则计算训练残差向量并构造残差训练数据集(X′train,Ytrain=Ytrain-Y′train),并重复Step2和Step3,直至模型满足R2相关系数阈值,从而构造MLRC-LSSVR预测模型,通过额外k-1个LSSVR残差预测模型实现对预测残差的在线同步修正,其中,k为MLRC-LSSVR预测模型层级。进一步的,所述模型预测过程的工作步骤描述如下:步骤1:重构n时刻的预测数据集Xpredict={Xtrain,Xpredict},其中对Xpredict进行coifN小波分解,得到n时刻的高维输入预测向量X′predict=(Am,predict,D1,predict,...Dm,predict);步骤2:将高维输入预测向量X′predict输入MLRC-LSSVR预测模型,得到MLRC-LSSVR多级预测输出{Y′predict,RC1,predict,...RCk-1,predict},从而得到其中,RCj,predict为第j个LSSVR残差预测模型的预测输出。步骤3:基于中心极限理论进行线性平滑和偏置修正,对残差(RCk-1,train,RCk-1,predict)进行方差估计,从而得到相应的预测置信上界YPpredict=Ypredict+RCPk-1,predict,其中,RCPk-1,predict为k-1级残差的97%置信估计方差;重复步骤1-3的模型预测过程,可以实现PM2.5预测浓度的在线预测和置信上限估计。此外,随着PM2.5浓度时序的不断更新,为了消除长期历史稳态偏置信息的冗余,所构造的AMLRC-LSSVR预测模型,可以结合时序区间更新数据定期重复上述训练过程,提高模型在线预测的有效性。一种基于非线性理论的PM2.5预测与预警系统,包括:数据处理单元,用于将PM2.5浓度时序数据分为训练时序数据集及测试时序训练集;小波分解单元,用于对所述训练时序数据集的数据进行S级小波分解,进行时频分析,将一维信息扩展为高维信息,提取PM2.5历史数据的隐含信息,得到训练时序指标数据集;支持向量回归预测单元,用于构造基于多级残差修正的非线性最小二乘支持向量回归(AMLRC-LSSVR)的预测模型;对AMLRC-LSSVR模型进行训练;针对测试时序训练集,进行MLRC-LSSVR模型预测,对模型预测结果做方差分析,得到置信区间的上界值作为最终的预测结果。与现有技术相比,本专利技术的有益效果是:本专利技术提供了多级残差修正的方法,能够避免误差的累积效应,提高预测精度;本专利技术针对预测结果进行方差分析,能够避免预测的不确定性问题;本专利技术能够提供模型的可调参数,通过改变可调参数从而适应不同地区PM2.5浓度的预测预警工作。附图说明构成本申请的一部分的说明书附图用来提供对本申本文档来自技高网
...

【技术保护点】
1.一种基于非线性理论的PM2.5预测与预警方法,其特征是,包括:模型训练步骤和模型预测步骤;针对PM2.5浓度时序数据分为两组,分别作为训练时序数据集及测试时序训练集;对所述训练时序数据集的数据进行S级小波分解,进行时频分析,将一维信息扩展为高维信息,提取PM2.5历史数据的隐含信息,得到训练时序指标数据集;然后构造基于多级残差修正的非线性最小二乘支持向量回归AMLRC‑LSSVR的预测模型;对AMLRC‑LSSVR模型进行训练;针对测试时序训练集,进行MLRC‑LSSVR模型预测,对模型预测结果做方差分析,得到置信区间的上界值作为最终的预测结果。

【技术特征摘要】
1.一种基于非线性理论的PM2.5预测与预警方法,其特征是,包括:模型训练步骤和模型预测步骤;针对PM2.5浓度时序数据分为两组,分别作为训练时序数据集及测试时序训练集;对所述训练时序数据集的数据进行S级小波分解,进行时频分析,将一维信息扩展为高维信息,提取PM2.5历史数据的隐含信息,得到训练时序指标数据集;然后构造基于多级残差修正的非线性最小二乘支持向量回归AMLRC-LSSVR的预测模型;对AMLRC-LSSVR模型进行训练;针对测试时序训练集,进行MLRC-LSSVR模型预测,对模型预测结果做方差分析,得到置信区间的上界值作为最终的预测结果。2.如权利要求1所述的一种基于非线性理论的PM2.5预测与预警方法,其特征是,所述预测模型可调参数为:小波分解层数s,最小二乘支持向量机回归的参数,包括核函数参数以及正则化参数γ,可通过遗传算法来寻优获得。3.如权利要求1所述的一种基于非线性理论的PM2.5预测与预警方法,其特征是,基于多级残差修正的非线性最小二乘支持向量回归MLRC-LSSVR预测模型描述如下:训练输入:训练数据集其中,预测输出:n+1时刻PM2.5污染物的预测浓度4.如权利要求1所述的一种基于非线性理论的PM2.5预测与预警方法,其特征是,所述模型训练步骤:步骤1:对训练数据集中Xtrain进行coifN小波变换,得到m层高维输入训练矩阵x′train={X′train,1,X′train,2,...X′train,n-1}其中,构造LSSVR模型训练数据集(X′train,Ytrain)∈R(n-1)×(m+2);步骤2:基于训练数据集(X′train,Ytrain)对LSSVR模型进行训练,训练过程采用搜索效率较高的simplex方法和10折交叉验证,优化搜索LSSVR的高斯核函数关键参数,并得到LSSVR训练终值Y′train;步骤3:计算LSSVR训练终值Y′train与Ytrain之间的R2相关系数R2(Y′train,Ytrain);步骤4:如果R2相关系数R2(Y′train,Ytrain)小于预设的R2相关系数阈值,则计算训练残差向量并构造残差训练数据集(X′train,Ytrai...

【专利技术属性】
技术研发人员:尹建光彭飞谢连科臧玉魏马新刚韩悦刘辉王坤巩泉泉窦丹丹张国英李方伟李佳煜郭本祥闫文晶崔翔宇
申请(专利权)人:国网山东省电力公司电力科学研究院国家电网公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1