一种基于注意力LSTM网络的天气预测方法技术

技术编号：41203759 阅读：8 留言：0更新日期：2024-05-07 22:29

本发明专利技术公开了一种基于注意力LSTM网络的天气预测方法，属于机器学习领域。该方法包括：获取天气数据集，对数据集进行预处理，将其划分为训练集和测试集，得到用于训练和测试预测网络的序列数据；在PredRNN++网络预测单元Causal LSTM的基础上，本发明专利技术提出时序LSTM预测单元(Temporal Attention LSTM，TA‑LSTM)，通过引入时序注意力模块(Temporal Attention Module，TAM)，拓宽了预测网络的时间感受野，增强了网络的时间信息建模能力，同时，通过引入局部注意力机制(Local Attention，LA)，增强了网络的空间信息建模能力；堆叠多层TA‑LSTM单元，构建天气预测网络；利用训练集对网络进行训练，优化网络参数；将测试集输入到训练好的预测网络，获得预测的天气序列，并使用评价指标对预测结果进行评估。与现有的预测方法相比，使用TA‑LSTM预测网络能得到更准确的预测结果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于计算机视觉以及预测学习领域，具体涉及一种基于注意力lstm网络的天气预测方法。

技术介绍

1、准确及时的天气预报可以减少恶劣天气对社会经济、人民生命和财产安全的影响。预测极端天气对于预防自然灾害和最大限度地减少人类生命财产损失至关重要。随着遥感技术的发展，可以采集到越来越多的气象数据，这为天气预报的研究提供了大量的数据支持，天气预报在计算机视觉领域受到越来越多的关注。然而，由于气象状况的多变性和复杂性，天气预报一直是一项艰巨的任务。

2、传统的天气预报方法由于其预测成本较大，无法提供小规模实时的预测，不能完全满足实时预报的要求。深度学习可有效地从大量数据中学习数据模式，为天气预报提供了新思路。基于深度学习的天气预报方法可以大致分为三种类型：基于卷积神经网络方法(cnn)、基于递归神经网络(rnn)的预测方法和基于生成式对抗网络(gan)的预测方法。由于传统的rnn网络中使用的长短期记忆单元(lstm)缺乏对图像数据的空间感知能力，convlstm通过将lstm中的全连接层替换为卷积层，从而能够捕获时空序列数据中空间的变换。predrnn通过在convlstm的基础上引入时空记忆流，提升了模型对时空序列数据进行建模的能力。predrnn++提出causal lstm预测单元，并在predrnn基础上增加了梯度高速单元(ghu)，减缓了梯度消失的问题。然而，基于rnn的预测方法往往不能有效利用较远时间步的历史信息，导致预测结果不准确。针对以上问题，本专利技术在predrnn++的基础上提出两点改进：(1)基

技术实现思路

1、本专利技术目的在于克服现有技术中的不足，提供一种基于注意力lstm网络的天气预测方法。

2、本专利技术所采用的技术方案是，一种基于注意力lstm网络的天气预测方法，具体按照以下步骤实施：

3、步骤1、获取天气序列数据集，对数据进行预处理，将其划分为训练集和测试集，得到用于训练和测试预测网络的序列数据；

4、步骤2、基于注意力机制对历史序列信息根据其重要性进行聚合，并构建时序注意力模块(tam)，引入局部注意力机制(la)，增强模型学习复杂空间关系的能力，将时序注意力模块(tam)以及局部注意力机制(la)与causal lstm相结合构成时序注意力长短期记忆单元(ta-lstm)；

5、步骤3、将多个ta-lstm单元以及ghu单元的输入与输出相连，构建用于预测天气的网络；

6、步骤4、基于步骤1中获取的训练集对步骤3中搭建的预测网络进行训练，优化网络参数；

7、步骤5、将步骤1中获取的测试集天气序列输入到步骤4中训练好的预测网络，获得预测天气序列，并使用评价指标对预测结果进行评估。

8、本专利技术的特点还在于：

9、步骤1中，具体做法为：

10、(1)将获取的天气数据集划分为训练集与测试集；

11、(2)对天气图像数据集中的数据进行归一化处理，转化为灰度图像数据。

12、步骤2中，具体做法为：

13、对于一个堆叠l层(l≥1)的rnn预测网络，在时间步t(t≥1)时，第k层的输入信息输入信息应为k＝1时的输入帧xt，其中，c表示通道数，h和w分别表示高度和宽度。在时间步t(t≥1)时，使用通过t组1×1卷积核wq，wk，wv将映射为使用ta用来表示聚合的时序注意力信息；ta的计算公式如下：

14、

15、其中d表示维度；

16、作为时序注意模块(tam)输入的时序注意信息如下：

17、

18、当k＝1时，输入的应为输入的图像帧xt；采用门控机制构建时序注意力模块(tam)，使其能够记住或忘记时序注意力信息，tam的具体状态转移公式如下：

19、

20、

21、

22、

23、其中w为卷积核dt与vt表示更新门和重置门，表示时序注意力流，表示从之前时间步的输入中提取的时序注意信息，tam的内部结构如图1所示；

24、将tam结合到causal lstm中，并引入局部注意力机制(la)，构建时序注意力长短期记忆单元(temporal attention-lstm，ta-lstm)；ta-lstm的具体状态转移公式如下：

25、

26、

27、

28、

29、

30、

31、

32、

33、

34、

35、

36、

37、其中la()表示局部注意力机制tam()表示时序注意力模块，将时序注意力信息与时序注意力流分别融合进ot与构建成ta-lstm。

38、步骤3中，具体做法为：

39、将4n层ta-lstm单元与n层ghu单元进行堆叠构建预测网络，具体方法为：初始化4n层ta-lstm及n层的ghu，将所有单元的隐藏状态初始化为0；

40、将4n层ta-lstm单元与ghu单元按规律进行串联，ta-lstm单元作为第一层，其输出作为第二层ghu单元的输入，ghu的输出作为第三层ta-lstm的输入，往后再堆叠两层ta-lstm。

41、步骤4中，具体做法为：

42、将训练集中的序列数据按时间步顺序依次作为ta-lstm预测网络第一层的输入，经预测网络层层计算得到下一时间步的预测，在预测未来帧的阶段采用定期采样训练策略，在序列数据全部输入完成后将得到的所有预测图像与对应的真实图像的均方误差作为损失函数，使用反向传播算法更新网络参数。

43、步骤5中，具体做法为：

44、将测试集序列输入到训练好的预测网络中得到生成的预测结果，将根均方误差(rmse)，平均绝对误差(mae)作为评价指标对预测结果进行评价，对于雷达回波数据集采用降水预报准确性指标，即关键成功指数(csi)和heidke技能评分(hss)作为评价指标；

45、根均方误差(rmse)的计算方法如下：

46、

47、其中，m为图像x的像素总数，n为图像y的像素总数，rmse值越小，说明图像越相似；

48、平均绝对误差(mae)的计算方法如下：

49、

50、对于雷达回波数据集，其像素值(p)与雷达反射率值(dbz)之间的关系如下：

51、

52、雷达反射率值(dbz)与降水强度值(r：mm/h)的关系如下：

本文档来自技高网...

【技术保护点】

1.一种基于注意力LSTM网络的天气预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于注意力LSTM网络的天气预测方法，其特征在于，所述步骤1中，具体为：

3.根据权利要求1所述的一种基于注意力LSTM网络的天气预测方法，其特征在于，所述步骤2中，具体为：

4.根据权利要求1所述的一一种基于注意力LSTM网络的天气预测方法，其特征在于，所述步骤3中，具体为：

5.根据权利要求1所述的一种基于注意力LSTM网络的天气预测方法，其特征在于，所述步骤4中，具体为：

6.根据权利要求1所述的一种基于注意力LSTM网络的天气预测方法，其特征在于，所述步骤5中，具体为：

【技术特征摘要】

1.一种基于注意力lstm网络的天气预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于注意力lstm网络的天气预测方法，其特征在于，所述步骤1中，具体为：

3.根据权利要求1所述的一种基于注意力lstm网络的天气预测方法，其特征在于，所述步骤2中，具体为：

4.根据...

【专利技术属性】
技术研发人员：董静，张峻茁，刘厂，成巍，
申请(专利权)人：南京工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人