当前位置: 首页 > 专利查询>河海大学专利>正文

基于CSVMD-LSTM-ELM的水文时间序列预测方法技术

技术编号:34563122 阅读:14 留言:0更新日期:2022-08-17 12:51
本发明专利技术公开一种基于CSVMD

【技术实现步骤摘要】
基于CSVMD

LSTM

ELM的水文时间序列预测方法


[0001]本专利技术属于水文预测技术,具体涉及一种基于CSVMD

LSTM

ELM的水文时间序列预测方法。

技术介绍

[0002]近年来,洪水灾害事件危及到了人民的生命安全和财产安全。为了在灾难发生前给人民预留足够的时间做好撤离工作,需要对水文数据实施准确和准时的预测。
[0003]目前,用于水文预测的模型主要有概念模型、物理模型和数据驱动模型。前两种模型需要水文现象的具体物理过程和大量的水文参数作支撑,具有一定的局限性。而数据驱动模型只需要历史数据就能实现模型的建立与未来数据的预测,因此,它受到广泛的应用。
[0004]基于数据驱动建立水文预测模型能对时间序列进行拟合,建立预测模型以预测未来的水文数据,常见的数据驱动模型有长短期记忆神经网络、支持向量机、极限学习机等,但单一的模型存在着预测的不足。随着机器学习的发展,许多的改进模型层出不穷,这些改进模型一般通过模型的优化、模型的组合等方法来提高预测的精度,克服单一模型的预测局限性,并且这些模型常常以均方根误差、平均绝对误差和确定性系数这些整体拟合指标来对预测模型进行评价,得到的预测模型在预测准确性方面得到了很好的提升,但由于时间序列间存在着高度的自相关性,并且一段时间序列存在着多个尺度的信息,因此,基于数据驱动的预测模型往往存在预测延迟的问题,即,预测序列的形态往往与真实序列相似,但仔细观察后,预测序列其实是真实序列平移后的结果。因此,这种现象并不会导致高的预测误差,反而得到的误差较小,产生“预测效果良好”的假象,但是会使时间序列的预测准时性较差。这个问题可能会带来严重的后果,例如,在洪水预报中,如果出现预测延迟问题,指令来不及发出,人员来不及撤离,可能会带来巨大的人员伤亡。因此,在提高预测模型数据值预测的准确性的同时,也要考虑预测模型数据值预测的准时性。

技术实现思路

[0005]专利技术目的:本专利技术的目的在于解决现有预测模型中存在预测准时性的不足,提供一种基于CSVMD

LSTM

ELM的水文时间序列预测方法,通过数据预处理的相关技术,对水文时间序列进行预测研究。
[0006]技术方案:本专利技术的一种基于CSVMD

LSTM

ELM的水文时间序列预测方法,包括以下步骤。
[0007]步骤S1、水文时间序列的预测延迟问题是由于时间序列间的高自相关性引起的,利用变分模态分解(Variational Mode Decomposition,VMD)作为时间序列的分解算法削弱时间序列的高自相关性,并结合布谷鸟搜索算法对该过程进行寻优,以保证得到时间序列处于最优分解程度,其既可以削弱时间序列的相关性,又保留它的时间特征,从而实现对水文数据集的预处理。
[0008]步骤S2、将分解之后的时间序列在历史上前十小时的水位数据作为输入数据,未
来第三小时的预测水位作为输出数据进行整合,并按8∶2的比例划分为训练集和测试集,提出使用基于长短期记忆神经网络(Long and Short

Term Memory Neural Network,LSTM)和极限学习机(Extreme Learning Machine,ELM)两种神经网络对数据集进行训练。首先,对分解之后的子序列分别基于两种神经网络进行训练,得到两种预测模型;其次,利用评价指标对以上两种预测模型进行评价,以得到每个分解子序列的最优预测模型;最后,将最优模型进行组合建立CSVMD

LSTM

ELM预测模型。
[0009]进一步,所述步骤S1中使用VMD时间序列进行了分解,去除了时间序列间的高自相关性,并将时间序列中包含的多个尺度的信息分离开,在此过程中,利用CS对时间序列的分解过程进行了寻优,构成了CS

VMD算法进行时间序列的预处理,输出为分解程度最优的子时间序列。
[0010]其中,使用CS

VMD对时间序列进行分解的具体步骤为:
[0011]步骤S1.1、按照VMD的两个参数的范围,包括分解个数和惩罚因子,初始化一系列VMD的参数组合的值;
[0012]步骤S1.2、按照VMD的参数组合值建立预测模型,具体包括进行时间序列的分解、神经网络训练等步骤;
[0013]步骤S1.3、利用测试数据集对所有参数建立好的预测模型进行测试,计算模型预测序列与实际序列之间的延迟时间,并求得适应度函数的值,并寻找当前参数组合中的最优解。其中,适应度函数与延迟时间有关,具体公式如下:
[0014][0015]其中:L为优化算法的适应度函数;R2为预测结果的确定性系数,随着R2的增大而减小,它与适应度的变化方向相同;T
Lag
为衡量预测结果是否延迟的一个变量。当延迟时间大于0时,T
Lag
为500;否则,T
Lag
为1。
[0016]步骤S1.4、更新每组的参数组合值,再次计算新组合的适应度函数的值。其中,更新组合值时结合了Levy飞行中的搜索方式。
[0017]步骤S1.5、将新一批的参数组合中的最优解与前一次迭代的最优解进行比较,选出新的最优解。并按发现概率丢弃适应度差的解。
[0018]步骤S1.6、继续迭代,更新参数组合的值,直到满足指定的停止条件。
[0019]步骤S1.7、输出VMD参数的最优组合,并按照该参数组合对时间序列进行分解,实现对水文数据集的预处理操作。
[0020]3、所述步骤S2中基于LSTM和ELM进行预测模型的建立,对分解后的每个子序列基于两种神经网络结构建立预测模型,并利用评价指标选择出针对每个子序列最优的预测模型,以避免单一网络对预测结果的局限性。并且采用的LSTM神经网络在处理较长时间序列方面有很好的性能,而ELM神经网络建立模型的速度快。两者结合可以达到良好的预测效果。
[0021]其中,使用LSTM和ELM建立预测模型的具体步骤为:
[0022]步骤S2.1、首先对分解得到的子序列进行训练集和测试集的划分,并利用训练集建立基于LSTM和ELM的神经网络预测模型,对每个子序列的最优预测模型进行组合得到最终的预测模型。
[0023]步骤S2.2、利用指定的评价指标对两种神经网络的模型进行评价与选择,从而得到针对每个子序列最优的预测模型,评价指标如下所示:
[0024](1)均方根误差,它用来反映预测结果的离散程度。公式定义为:
[0025][0026](2)平均绝对误差,它是真实值和预测值的绝对误差的均值。公式定义为:
[0027][0028](3)确定性系数,它反映了预测值与真实值之间的吻合程度。公式定义为:
[0029][0030]式(1)~(3)中:y
pi
...

【技术保护点】

【技术特征摘要】
1.一种基于CSVMD

LSTM

ELM的水文时间序列预测方法,其特征在于:包括以下步骤:步骤S1、水文时间序列的预测延迟问题是由于时间序列间的高自相关性引起的,利用变分模态分解(Variational Mode Decomposition,VMD)作为时间序列的分解算法削弱时间序列的高自相关性,并结合布谷鸟搜索算法对该过程进行寻优,以保证得到时间序列处于最优分解程度,其既可以削弱时间序列的相关性,又保留它的时间特征,从而实现对水文数据集的预处理;步骤S2、将分解之后的时间序列在历史上前十小时的水位数据作为输入数据,未来第三小时的预测水位作为输出数据进行整合,并按8∶2的比例划分为训练集和测试集,提出使用基于长短期记忆神经网络(Long and Short

Term Memory Neural Network,LSTM)和极限学习机(Extreme Learning Machine,ELM)两种神经网络对数据集进行训练。首先,对分解之后的子序列分别基于两种神经网络进行训练,得到两种预测模型;其次,利用评价指标对以上两种预测模型进行评价,以得到每个分解子序列的最优预测模型;最后,将最优模型进行组合建立CSVMD

LSTM

ELM预测模型。2.根据权利要求1所述的一种基于CSVMD

LSTM

ELM的水文时间序列预测方法,其特征在于:所述步骤S1中使用VMD对时间序列进行了分解,去除了时间序列间的高自相关性,并将时间序列中包含的多个尺度的信息分离开,在此过程中,利用CS对时间序列的分解过程进行了寻优,构成了CSVMD算法进行时间序列的预处理,输出为分解程度最优的子时间序列。其中,使用CSVMD对时间序列进行分解的具体步骤为:步骤S1.1、按照VMD的...

【专利技术属性】
技术研发人员:梁正和马心雨朱跃龙
申请(专利权)人:河海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1