The invention discloses a PM2.5 prediction and early warning method and system based on nonlinear theory, a model training step and a model prediction step; divides the PM2.5 concentration time series data into two groups, which are the training time series data set and the test time series training set respectively; carries out S-level wavelet decomposition on the training time series data set, and advances. Line time-frequency analysis expands one-dimensional information into high-dimensional information, extracts the implicit information of PM2.5 historical data, and obtains the training time series index data set; constructs the prediction model; trains the prediction model; carries on the MLRC_LSSVR model forecast for the test time series training set, makes the variance analysis to the model forecast result, obtains the confidence. The upper bound value of the interval is taken as the final prediction result. The invention can provide the adjustable parameters of the model and adapt to the prediction and early warning work of PM2.5 concentration in different areas by changing the adjustable parameters.
【技术实现步骤摘要】
一种基于非线性理论的PM2.5预测与预警方法及系统
本专利技术涉及空气质量预测与预警领域,特别是涉及一种基于非线性理论的PM2.5预测与预警方法及系统。
技术介绍
雾霾的主要成分就是PM2.5,PM2.5是粒径小于2.5μm的颗粒物,是一种胶体混合物。PM2.5的影响因素复杂,其浓度变化呈现出非线性特征。目前大气污染物浓度预测方法主要有统计模型和确定性模型两类。其中,统计模型一般是基于历史数据建立空气质量与影响因素之间的关联模型,其优点在于对输入数据要求相对较低,但预测精度较低,难以反映区域空气质量且无法对污染成因以及来源等给出合理解释;数值模型则是依据不同尺度大气动力学理论,耦合大气物理和化学变化过程,建立多尺度类型大气污染物扩散模型,依靠计算机系统预报大气污染物浓度变化趋势和动态分布情况,其优点是能够对污染成因进行诊断,计算精确,能够对区域内大气污染物浓度进行预测,其局限性在于时效性污染排放数据获取困难,模型对数据要求高,实际操作困难较大。鉴于数值预报所需成本消耗较高,存在较多的不确定因素,模型建立过程和数据需求要求较复杂,众多的研究倾向于以统计模型为主要手段开展大气污染物浓度预测,特别是针对单站点统计模型预报开展了大量的改进研究。很多研究者将传统的统计学方法与神经网络模型、自回归移动平均模型、多元线性回归模型相结合获得了较为理想的预测结果。而从方法学的角度来看,自回归移动平均模型和多元线性回归模型均是线性模式,某些非线性的关系很难被精确预测,这种缺陷已在某些实例研究中体现出来;神经网络模型作为一种非线性映射方法,其多层感知模式使得神经网络模型在细微颗 ...
【技术保护点】
1.一种基于非线性理论的PM2.5预测与预警方法,其特征是,包括:模型训练步骤和模型预测步骤;针对PM2.5浓度时序数据分为两组,分别作为训练时序数据集及测试时序训练集;对所述训练时序数据集的数据进行S级小波分解,进行时频分析,将一维信息扩展为高维信息,提取PM2.5历史数据的隐含信息,得到训练时序指标数据集;然后构造基于多级残差修正的非线性最小二乘支持向量回归AMLRC‑LSSVR的预测模型;对AMLRC‑LSSVR模型进行训练;针对测试时序训练集,进行MLRC‑LSSVR模型预测,对模型预测结果做方差分析,得到置信区间的上界值作为最终的预测结果。
【技术特征摘要】
1.一种基于非线性理论的PM2.5预测与预警方法,其特征是,包括:模型训练步骤和模型预测步骤;针对PM2.5浓度时序数据分为两组,分别作为训练时序数据集及测试时序训练集;对所述训练时序数据集的数据进行S级小波分解,进行时频分析,将一维信息扩展为高维信息,提取PM2.5历史数据的隐含信息,得到训练时序指标数据集;然后构造基于多级残差修正的非线性最小二乘支持向量回归AMLRC-LSSVR的预测模型;对AMLRC-LSSVR模型进行训练;针对测试时序训练集,进行MLRC-LSSVR模型预测,对模型预测结果做方差分析,得到置信区间的上界值作为最终的预测结果。2.如权利要求1所述的一种基于非线性理论的PM2.5预测与预警方法,其特征是,所述预测模型可调参数为:小波分解层数s,最小二乘支持向量机回归的参数,包括核函数参数以及正则化参数γ,可通过遗传算法来寻优获得。3.如权利要求1所述的一种基于非线性理论的PM2.5预测与预警方法,其特征是,基于多级残差修正的非线性最小二乘支持向量回归MLRC-LSSVR预测模型描述如下:训练输入:训练数据集其中,预测输出:n+1时刻PM2.5污染物的预测浓度4.如权利要求1所述的一种基于非线性理论的PM2.5预测与预警方法,其特征是,所述模型训练步骤:步骤1:对训练数据集中Xtrain进行coifN小波变换,得到m层高维输入训练矩阵x′train={X′train,1,X′train,2,...X′train,n-1}其中,构造LSSVR模型训练数据集(X′train,Ytrain)∈R(n-1)×(m+2);步骤2:基于训练数据集(X′train,Ytrain)对LSSVR模型进行训练,训练过程采用搜索效率较高的simplex方法和10折交叉验证,优化搜索LSSVR的高斯核函数关键参数,并得到LSSVR训练终值Y′train;步骤3:计算LSSVR训练终值Y′train与Ytrain之间的R2相关系数R2(Y′train,Ytrain);步骤4:如果R2相关系数R2(Y′train,Ytrain)小于预设的R2相关系数阈值,则计算训练残差向量并构造残差训练数据集(X′train,Ytrai...
【专利技术属性】
技术研发人员:尹建光,彭飞,谢连科,臧玉魏,马新刚,韩悦,刘辉,王坤,巩泉泉,窦丹丹,张国英,李方伟,李佳煜,郭本祥,闫文晶,崔翔宇,
申请(专利权)人:国网山东省电力公司电力科学研究院,国家电网公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。