基于麻雀搜索算法和分解误差校正的短期空气质量预测方法技术

技术编号:36538797 阅读:17 留言:0更新日期:2023-02-01 16:31
本发明专利技术提出了一种基于麻雀搜索算法和分解误差校正的短期空气质量预测方法,包括以下步骤:S1,使用CEEMDAN分解算法对数据进行分解,得到若干IMF;S2,使用深度学习模型对所述若干IMF进行预测,对多个深度学习模型的预测误差进行处理,得到每个深度学习模型的权重;所述深度学习模型的数量至少两个;S3,根据权重将每个深度学习模型的预测结果相结合,得到综合预测结果即多模型组合预测的结果。本发明专利技术通过将空气质量预测与时间序列分解相结合,且采用组合预测的方法,使用权重将各个模型的预测结果结合起来,可以得到精度更高的空气质量预测结果。预测结果。预测结果。

【技术实现步骤摘要】
基于麻雀搜索算法和分解误差校正的短期空气质量预测方法


[0001]本专利技术涉及空气污染预测
,特别是涉及一种基于麻雀搜索算法和分解误差校正的短期空气质量预测方法。

技术介绍

[0002]人类长期暴露在污染的空气中会导致健康受到影响。根据世界卫生组织(WHO)的研究,与空气污染接触相关的全球疾病负担对全世界的人类健康造成了巨大损失。据估计,空气污染造成的疾病负担与不健康饮食和吸烟等其他主要全球健康风险相当,空气污染现在被认为是对人类健康最大的环境威胁。因此,根据过去的空气质量数据预测未来的空气质量有着重大的研究意义。不仅体现在对空气污染情况的预警上,还体现在更好的规划和决策城市的发展方向,更好的保护人类的身体健康上。
[0003]目前关于空气质量预测的方法主要集中在对未来空气质量数据的预测准确度上,而忽略了预测误差和参数的简化,这会导致预测精度不高和运算时间长。

技术实现思路

[0004]本专利技术旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种基于麻雀搜索算法和分解误差校正的短期空气质量预测方法。
[0005]为了实现本专利技术的上述目的,本专利技术提供了一种基于麻雀搜索算法和分解误差校正的短期空气质量预测方法,包括以下步骤:
[0006]S1,使用CEEMDAN分解算法对数据进行分解,得到若干IMF;
[0007]S2,使用深度学习模型对所述若干IMF进行预测,对多个深度学习模型的预测误差进行处理,得到每个深度学习模型的权重;所述深度学习模型的数量至少两个;
[0008]S3,根据权重将每个深度学习模型的预测结果相结合,得到综合预测结果即多模型组合预测的结果。
[0009]进一步地,所述深度学习模型包括:LSTM、Bi

LSTM、GRU和Bi

GRU。
[0010]进一步地,S2包括以下步骤:
[0011]S2

1,使用不同的深度学习模型对所述若干IMF进行预测,获得多个预测结果;同时,获得预测的数据和统计评价指标的值。
[0012]S2

2,采用简单平均法、MAE倒数法和拉格朗日乘数法中的任一算法对各模型的预测误差进行处理,得到每个深度学习模型的权重;
[0013]当采用所述简单平均法时,每个模型的权重相等;
[0014]当采用所述MAE倒数法时,每个模型的权重表示如下:
[0015][0016]其中S表示H个模型的预测结果的MAE的倒数之和,H为模型的总数量;
[0017]a
i
表示第i个模型的权重;
[0018]MAE
i
表示第i个模型的平均绝对误差;
[0019]当采用拉格朗日乘数法时,每个模型的权重通过如下公式求解获得:
[0020][0021]其中a
i
表示第i个模型的权重,i=(1,2,...,N);
[0022]N为模型的总数量;
[0023]表示对拉格朗日函数L(a,λ)中的a求偏导。
[0024]S2

3,最后将各个深度学习模型的预测结果与权重相结合,产生多模型组合预测的结果。
[0025]进一步地,在步骤S1前,对所述数据进行预处理,包括以下步骤:
[0026]S0

1,使用三次样条插值来填补缺失的数值;
[0027]S0

2,采用移动平均法来处理三次样条插值后的数据。
[0028]对数据进行预处理不仅可以处理原始数据中的异常和缺失数据,还可以消除原始数据中的周期性和季节性因素的影响,从而提高预测的准确性。
[0029]进一步地,所述深度学习模型是通过麻雀搜索算法训练获得,包括以下步骤:
[0030]SA,将经过CEEMDAN分解的数据进行归一化,然后分级成以0到1之间的统计概率均匀分布;归一化操作不仅加快了神经网络的收敛速度,还消除了奇数样本数据造成的不良影响。
[0031]SB,将经过分级的数据分为训练数据集和测试数据集;
[0032]SC,使用麻雀搜索算法SSA优化深度学习模型的超参数,所述超参数包括神经网络每层的神经元数量、迭代次数和学习率;
[0033]SD,采用深度学习模型对测试数据集进行预测,并根据评估指标进行评估,若模型的超参数没有发生过拟合且预测结果的误差最小则得到最优超参数,由此最优深度学习模型。若模型的超参数发生过拟合或不满足预测结果的误差最小则跳转步骤SC。
[0034]通过麻雀搜索算法使模型能够自适应地确定深度学习模型的参数,从而不需要人工设置,从而实现了参数的简化。
[0035]进一步地,所述评估指标包括:平均绝对误差、均方根误差、相关系数和平均绝对百分比误差中的任意组合。
[0036]进一步地,在步骤S1之前包括S0,获取数据,该数据为气象数据。
[0037]进一步地,所述数据为短期气象数据,采集时间为连续的24~72小时。
[0038]综上所述,由于采用了上述技术方案,本专利技术通过将空气质量预测与时间序列分解相结合,且采用组合预测的方法,使用权重将各个模型的预测结果结合起来,由此可以得到精度更高的空气质量预测结果。
[0039]本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变
得明显,或通过本专利技术的实践了解到。
附图说明
[0040]本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
[0041]图1是本专利技术的整体结构示意图。
[0042]图2是LSTM、Bi

LSTM、GRU和Bi

GRU的网络结构示意图,图2(a)是LSTM网络结构图,图2(b)是BiLSTM网络结构图,图2(c)是GRU网络结构图,图2(d)是Bi

GRU网络结构。
[0043]图3是具体实施例北京的空气质量指数数据和北京的监测站位置示意图,图3(a)是北京的空气质量指数数据;图3(b)是北京的监测站的位置。
[0044]图4是本专利技术数据预处理的结果和处理时间序列的多步骤深度学习模型示意图,图4(a)是三次样条插值的部分结果图,4(b)是移动平均线法的结果图,图4(c)是用于处理时间序列的多步骤深度学习模型图,4(d)是使用移动平均法后在Day 0到Day 120的局部图。
[0045]图5是具体实施例CEEMDAN的分解结果和归一化结果,图5(a)是CEEMDAN的分解结果,图5(b)是CEEMDAN分解结果进行归一化后的结果。
[0046]图6是本专利技术不同深度神经模型上是否使用分解算法的结果示意图,图6(a)、图6(b)是使用分解算法前后模型的预测结果示意图,图6(c)是预测结果的误差示意图。
[0047]图7是各个模型的统计指标和预测结果的变本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于麻雀搜索算法和分解误差校正的短期空气质量预测方法,其特征在于,包括以下步骤:S1,使用CEEMDAN分解算法对数据进行分解,得到若干IMF;S2,使用深度学习模型对所述若干IMF进行预测,对多个深度学习模型的预测误差进行处理,得到每个深度学习模型的权重;所述深度学习模型的数量至少两个;S3,根据权重将每个深度学习模型的预测结果相结合,得到综合预测结果即多模型组合预测的结果。2.根据权利要求1所述的一种基于麻雀搜索算法和分解误差校正的短期空气质量预测方法,其特征在于,所述深度学习模型包括:LSTM、Bi

LSTM、GRU和Bi

GRU。3.根据权利要求1所述的一种基于麻雀搜索算法和分解误差校正的短期空气质量预测方法,其特征在于,S2包括以下步骤:S2

1,使用不同的深度学习模型对所述若干IMF进行预测,获得多个预测结果;S2

2,采用简单平均法、MAE倒数法和拉格朗日乘数法中的任一算法对各模型的预测误差进行处理,得到每个深度学习模型的权重;S2

3,最后将各个深度学习模型的预测结果与权重相结合,产生多模型组合预测的结果。4.根据权利要求1所述的一种基于麻雀搜索算法和分解误差校...

【专利技术属性】
技术研发人员:车金星胡焜
申请(专利权)人:南昌工程学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1