一种基于WCEEMDAN和ILSTM的PM2.5浓度预测方法技术

技术编号:36850172 阅读:46 留言:0更新日期:2023-03-15 17:09
本发明专利技术公开了一种基于WCEEMDAN和ILSTM的PM2.5浓度预测方法,涉及PM2.5浓度预测领域,解决了现有的PM2.5的预测方法的预测性能受限较大,精度低的问题,现提出如下方案,其用CEEMDAN数据分解方法降低PM2.5原始数据序列的复杂性,赋予分量模态不同的相关性权重系数,更好地提取相关特征,采用AMPSO算法优化LSTM网络超参数,减少人为因素影响,提高模型预测性能。具有更高的预测精度,并且对于不用地区的PM2.5浓度数据具有一定的普遍适用性。地区的PM2.5浓度数据具有一定的普遍适用性。地区的PM2.5浓度数据具有一定的普遍适用性。

【技术实现步骤摘要】
一种基于WCEEMDAN和ILSTM的PM2.5浓度预测方法


[0001]本专利技术涉及PM2.5浓度预测领域,尤其涉及一种基于WCEEMDAN和ILSTM的PM2.5浓度预测方法。

技术介绍

[0002]大气污染预测作为大气污染防治的核心,对人类的生存和发展具有十分重要的意义。PM2.5是指空气中空气动力学当量直径小于或等于2.5μm的粉尘颗粒物,这种颗粒物能够很长时间的悬浮于空气中,可能造成严重的空气污染。许多流行病学研究发现了环境颗粒物水平与健康影响之间的关系。特别是在新冠疫情期间,空气污染物浓度的增加很可能对人类健康构成重大风险。最近的报道吸引了大量研究者深入探索空气污染与Covid

19的相关性,相关研究发现PM2.5浓度每增加1μg/m3,Covid

19的死亡率就增加11%。因此,有必要挖掘PM2.5浓度历史数据的时序特性,建立一个高精度、有效的PM2.5预测模型。
[0003]目前PM2.5的预测方法主要分为三大类:物理模型、统计模型和数据驱动模型。物理模型的建立需要对污染物形成机制和气象理论的深刻理解,并且需要苛刻的假设,这是非常复杂和耗时的。所建立的物理模型与区域关联度极高,难以适用于各种场景。统计方法基于历史数据构建了统计模型来推断未来时间序列,在一定程度上缓解了物理模型的局限性。统计模型结构简单,建模成本低,可以更快地从历史数据中学习规则。Dong等人提出了一种基于隐式半马尔可夫模型的PM2.5浓度预测框架。Zhai等人开发了一种改进的地理信息加权回归建模方法,充分考虑考虑环境变量的空间非平稳贡献,准确估计了PM2.5浓度。Elbayoumi等人建立多元线性回归模型成功预测PM10和PM2.5的浓度。然而,这些模型只能够捕捉线性关系,PM2.5浓度的变化是复杂非线性的时变过程,限制了线性模型的预测性能。
[0004]随着机器学习理论的快速发展,数据驱动模型已成为PM2.5浓度预测的主流方法。Ibrir等人利用混合蜻蜓

支持向量机算法建立了PM2.5浓度预测模型,该模型具有较好的预测性能。Pak等人提出一种时空卷积神经网络和长短期记忆网络的PM2.5浓度预测模型,用于预测PM2.5日平均浓度。人工神经网络具有从过程数据中捕捉复杂、非线性动态的能力。在各种神经网络中,长短期记忆(long short

term memory network,LSTM)神经网络具有特殊的门控结构,能够学习长期依赖关系,在时间序列数据预测上表现出优越性。Chen等人设计一种新的RBF

LSTM模型来预测PM2.5浓度,该模型可以通过径向基函数的输出提取深度学习模型建模的关键特征。Shi等人利用社交池层来捕获局部空间相关性,提出了一种用于PM2.5浓度预测的BS

LSTM模型。Sagheer等人将LSTM网络和堆栈自编码器相结合,提出了一种LSTM

SAE无监督学习方法,用于预测北京市PM2.5浓度。一个准确的建模框架依赖于选择合适的超参数。在现有的大多数工作中,采用了不同的超参数选择方法,包括随机搜索、网格搜索、粒子群优化算法,其中前两种方法是耗时的试错方法。使得构造结构紧凑、预测性能优异的LSTM网络仍然是一项挑战。因此提出一种基于WCEEMDAN和ILSTM的PM2.5浓度预测方法。

技术实现思路

[0005]本专利技术的目的在于提供一种基于WCEEMDAN和ILSTM的PM2.5浓度预测方法,解决了现有的PM2.5的预测方法的预测性能受限较大,精度低的问题。
[0006]为实现上述目的,本专利技术提供如下技术方案:一种基于WCEEMDAN和ILSTM的PM2.5浓度预测方法,包括以下步骤:
[0007]S1:收集PM2.5浓度数据,在进行建模之前对离群值和异常值的数据进行处理,且为了避免维数和尺寸对建模的影响,对数据进行归一化处;
[0008]S2:将数据集分为训练集和测试集,对PM2.5数据x(t),(t=1,

,T)进行分解,得到n个有限平稳模态分量IMFs和一个残差;
[0009]S3:(1)计算各模态分量IMFs与输出变量的互信息相关系数,
[0010]其公式为:其中IMF
k
是第k个模态分量,当模态分量与输出变量具有明显或较高的相关性时,MI相关系数应较大,
[0011](2)由(1)可知相关性高的模态分量应乘以较大的权系数,第k个模态分量的权重应与MI相关系数成正比关系,公式为:
[0012][0013]式中,I
i
为模态分量与输出变量的MI相关系数,K为模态分量个数,进而得到各模态分量IMFs的权重系数,
[0014](3)最后,将权重系数重赋予各模态分量,加权后的各模态分量可作为LSTM网络的输入;
[0015]S4:(1)选取调优的三个主要超参数的范围,利用PSO算法优化LSTM网络的超参数,在PSO算法过程中,在算法中设计自适应调整w策略,其更新公式为:
[0016][0017]式中:w
max
、w
min
分别为惯性权重的最大值和最小值,一般取w
max
=0.9、w
min
=0.4;f为粒子实时目标函数值;f
min
、f
avg
为当前所有粒子的最小目标值和平均目标值;
[0018](2)采用粒子位置变异的策略,粒子位置更新公式为:
[0019][0020](3)判断是否满足变异条件,对粒子的位置与速度进行更新;
[0021]S5:满足PSO算法最大迭代次数后,得到具有最优超参数的LSTM训练模型,将测试数据送入训练好的LSTM模型,输出PM2.5预测值。
[0022]优选的,所述S2中利用CEEMDAN算法对PM2.5数据x(t),(t=1,

,T)进行分解。
[0023]优选的,所述S2的(2)中将加权后的各模态分量作为LSTM网络的输入后,下一时刻PM2.5浓度数据为输出,通过Adam算法对LSTM网络进行训练。
[0024]优选的,所述S4的(1)中迭代过程中对惯性权重进行调整,从而加快算法收敛速度,提高算法的局部搜索能力;同时引入变异机制,拓展了在迭代过程中不断缩小的种群搜
索空间,提高了算法寻找全局最优值的可能性。
[0025]优选的,所述S4的(1)中在粒子群寻优过程中,惯性权重w增大可使得算法跳出局部最优解,从而提高算法的全局搜索能力,减小w的值可提高算法的局部搜索能力,便于算法收敛。
[0026]与相关技术相比较,本专利技术提供的一种基于WCEEMDAN和ILSTM的PM2.5浓度预测方法具有如下有益效果:
[0027]1、本专利技术提供一种基于WCEEMDAN和ILSTM的PM2.5浓度预测方法,通过采用CEEMDAN数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于WCEEMDAN和ILSTM的PM2.5浓度预测方法,其特征在于,包括以下步骤:S1:收集PM2.5浓度数据,在进行建模之前对离群值和异常值的数据进行处理,且为了避免维数和尺寸对建模的影响,对数据进行归一化处;S2:将数据集分为训练集和测试集,对PM2.5数据x(t)

(t=1,

,T)进行分解,得到n个有限平稳模态分量IMFs和一个残差;S3:(1)计算各模态分量IMFs与输出变量的互信息相关系数,其公式为:其中IMF
k
是第
k
个模态分量,当模态分量与输出变量具有明显或较高的相关性时,MI相关系数应较大,(2)由(1)可知相关性高的模态分量应乘以较大的权系数,第k个模态分量的权重应与MI相关系数成正比关系,公式为:式中,I
i
为模态分量与输出变量的MI相关系数

K为模态分量个数,进而得到各模态分量IMFs的权重系数,(3)最后,将权重系数重赋予各模态分量,加权后的各模态分量可作为LSTM网络的输入;S4:(1)选取调优的三个主要超参数的范围,利用PSO算法优化LSTM网络的超参数,在PSO算法过程中,在算法中设计自适应调整w策略,其更新公式为:式中:w
max
、w
min
分别为惯性权重的最大值和最小值,一般取w
max
=0.9、w
min
=0.4;f为粒子实时目标函数值...

【专利技术属性】
技术研发人员:张莉胡平蔡希文刘金兰吴鹏丁世宁郝晨朱星星
申请(专利权)人:信阳农林学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1