一种基于注意力机制的级联LSTM短临降雨预测方法技术

技术编号:38141580 阅读:16 留言:0更新日期:2023-07-08 09:56
本发明专利技术公开了一种基于注意力机制的级联LSTM短临降雨预测方法,包括:将去噪后的图数据集输入至SAC

【技术实现步骤摘要】
一种基于注意力机制的级联LSTM短临降雨预测方法


[0001]本专利技术涉及降雨预测
,具体涉及一种基于注意力机制的级联LSTM短临降雨预测方法。

技术介绍

[0002]短临降雨预测是天气预报中的重要的研究领域之一,它能够根据当前天气情况,预测出未来0

2个小时的降雨强度预测值,预测结果可以减少泥石流和洪水等自然灾害导致的损失。但是,短临降雨预测存在复杂性、非线性和随机性,这仍然是一个非常具有挑战性的任务。
[0003]近些年来,传统的方法提出雷达回波跟踪算法(Cross

correlation Multi

Scale Tracking Radar Echo,MTREC)解决在不同的空间尺寸上影响雷达回波移动问题。这类方法大多数是线性确定的,而天气系统变化复杂的,在预测时要考虑非线性的变化,预测结果存在不稳定性。
[0004]随着深度学习在计算机视觉中的快速发展,受到了许多研究者的关注,开始使用深度学习来解决短临降雨预测的问题。循环神经网络(Recurrent Neural Network,RNN)和长短期记忆网络(Long Short

Term Memory)为基于雷达回波外推的短临降雨预测提供了序列到序列(Sequence to Sequence)的架构设计。但对于多维图形来说,其中有复杂的空间信息并且每个点之间有着很强的相关性,这就存在冗余性,传统的LSTM不能完全提取到这种空间特征。FC

LSTM(Fully Convolutional LSTM)将数据展开成一维进行预测,雷达回波数据存在大量冗余信息,FC

LSTM无法处理,而且FC

LSTM只能提取时间序列信息,无法提取空间信息。为了解决处理图像信息中的不足,ConvLSTM不仅能够建立LSTM时序关系,同时也能够利用CNN的空间提取能力。然而,ConvLSTM模型中的卷积递归结构是位置不变的(location invariant),而自然运动和变换(旋转)通常是位置变化的(location variant)。TrajGRU(轨迹门控单元模型)可以主动利用基于位置变化的结构来循环学习,通过学习轨迹来聚合状态。
[0005]针对时空预测任务,作为一种跨层交互的循环网络PredRNN模型,具有锯齿形记忆流(zigzag memory flow)的特点,该记忆流在所有层中自下而上和自上而下的方向传播,使得RNN不同层学习到的动态视觉信息能够相互通信。然而,这种复杂的结构依旧受梯度消失难题的困扰,通过时间的反向传播,梯度的幅度呈指数衰减,这是由于长时间的训练和依赖导致梯度消失的问题。PredRNN++利用时空单元的级联操作,增加非线性能力,有益于捕捉短期动态变化,同时使用GHU(梯度高速通道单元)把过去时段和未来时段进行相连,将重要特征通过GHU相传,缓减梯度消失的问题。
[0006]基于此,本专利技术注意到这些模型中都未考虑的一点是,受到卷积核尺寸的限制,当前帧的卷积核只能提取局部特征,无法依赖长距离的全局空间特征,导致预测帧的细节部分没有较好的显示出来。

技术实现思路

[0007]本专利技术的目的在于提供一种基于注意力机制的级联LSTM短临降雨预测方法,以能够有效提高短临降雨预测的精度。
[0008]本专利技术解决上述技术问题的技术方案如下:
[0009]本专利技术提供一种基于注意力机制的级联LSTM短临降雨预测方法,所述基于注意力机制的级联LSTM短临降雨预测方法包括:
[0010]S1:对t时刻的历史雷达回波图数据集进行清洗和去噪,得到去噪后的图数据集;
[0011]S2:将所述去噪后的图数据集输入至SAC

LSTM模型中,得到t+1时刻的预测雷达回波图数据集;
[0012]S3:对t+1时刻的真实雷达回波图数据集和所述t+1时刻的预测雷达回波图数据集进行MSE损失对比,得到第一对比结果;
[0013]S4:分别将所述t+1时刻的真实雷达回波图数据集和所述t+1时刻的预测雷达回波图数据集输入至对抗生成网络,进行卷积操作,得到去噪后的图数据集所对应的第一特征图数据集和所述t+1时刻的预测雷达回波图数据集所对应的第二特征图数据集;
[0014]S5:对所述第一特征图数据集和所述第二特征图数据集进行感知学习损失比较和对抗损失比较,得到第二比较结果;
[0015]S6:利用所述第一比较结果和所述第二比较结果更新所述SAC

LSTM模型的损失函数,得到更新后的SAC

LSTM模型;
[0016]S7:利用所述更新后的SAC

LSTM模型对当前输入雷达回波图数据集进行预测,得到雷达回波预测图像;
[0017]S8:对雷达回波预测图像进行Z

R变换,得到变换结果;
[0018]S9:利用所述变换结果进行降雨预测。
[0019]可选择地,所述S2中,在将所述去噪后的图数据集输入至SAC

LSTM模型中之前,所述基于注意力机制的级联LSTM短临降雨预测方还包括:
[0020]对所述去噪后的图数据集进行padding扩增数据长宽尺寸,再归一化成【0,1】范围,形成输入数据;
[0021]将所述输入数据输入至所述SAC

LSTM模型中,得到t+1时刻的预测雷达回波图数据集。
[0022]可选择地,所述S2中,所述SAC

LSTM模型包括基于注意力机制的级联长短期记忆单元和生成对抗网络;
[0023]所述基于注意力机制的级联长短期记忆单元用于根据去噪后的图数据集,得到t+1时刻的预测雷达回波图数据集;
[0024]所述生成对抗网络连接所述基于注意力机制的级联长短期记忆单元的输出层,且所述生成对抗网络包括判别器模块;
[0025]所述判别器模块用于估计输入帧为真实图像或生成图像。
[0026]可选择地,所述基于注意力机制的级联长短期记忆单元包括级联LSTM单元和自注意力机制模块,所述自注意力机制模块包括依次设置的矩阵乘积层、softmax函数层和数据融合层。
[0027]可选择地,所述S2包括:
[0028]将所述去噪后的图数据集输入至级联LSTM单元中,得到级联LSTM单元的输出结果;
[0029]对所述级联LSTM单元的输出结果按照权重矩阵拆分为第一权重数据和第二权重数据;
[0030]将所述第一权重数据和所述第二权重数据进行矩阵乘积操作,得到矩阵乘积结果;
[0031]根据所述矩阵乘积结果,利用softmax函数,得到值为不同通道的位置相似度;
[0032]将所述不同通道的位置相似度和所述级联LSTM单元的输出结果进行数据融合,得到的数据融合结果作为t+1时刻的预测雷达回波图数据集输本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制的级联LSTM短临降雨预测方法,其特征在于,所述基于注意力机制的级联LSTM短临降雨预测方法包括:S1:对t时刻的历史雷达回波图数据集进行清洗和去噪,得到去噪后的图数据集;S2:将所述去噪后的图数据集输入至SAC

LSTM模型中,得到t+1时刻的预测雷达回波图数据集;S3:对t+1时刻的真实雷达回波图数据集和所述t+1时刻的预测雷达回波图数据集进行MSE损失对比,得到第一对比结果;S4:分别将所述t+1时刻的真实雷达回波图数据集和所述t+1时刻的预测雷达回波图数据集输入至对抗生成网络,进行卷积操作,得到去噪后的图数据集所对应的第一特征图数据集和所述t+1时刻的预测雷达回波图数据集所对应的第二特征图数据集;S5:对所述第一特征图数据集和所述第二特征图数据集进行感知学习损失比较和对抗损失比较,得到第二比较结果;S6:利用所述第一比较结果和所述第二比较结果更新所述SAC

LSTM模型的损失函数,得到更新后的SAC

LSTM模型;S7:利用所述更新后的SAC

LSTM模型对当前输入雷达回波图数据集进行预测,得到雷达回波预测图像;S8:对雷达回波预测图像进行Z

R变换,得到变换结果;S9:利用所述变换结果进行降雨预测。2.根据权利要求1所述的基于注意力机制的级联LSTM短临降雨预测方法,其特征在于,所述S2中,在将所述去噪后的图数据集输入至SAC

LSTM模型中之前,所述基于注意力机制的级联LSTM短临降雨预测方还包括:对所述去噪后的图数据集进行padding扩增数据长宽尺寸,再归一化成【0,1】范围,形成输入数据;将所述输入数据输入至所述SAC

LSTM模型中,得到t+1时刻的预测雷达回波图数据集。3.根据权利要求1所述的基于注意力机制的级联LSTM短临降雨预测方法,其特征在于,所述S2中,所述SAC

LSTM模型包括基于注意力机制的级联长短期记忆单元和生...

【专利技术属性】
技术研发人员:佘磊赵磊邵杰
申请(专利权)人:四川省人工智能研究院宜宾
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1