融合时空粒度上下文神经网络的海表温度预测方法技术

技术编号:39674957 阅读:11 留言:0更新日期:2023-12-11 18:41
一种融合时空粒度上下文神经网络的海表温度预测方法,首先,在循环神经网络

【技术实现步骤摘要】
融合时空粒度上下文神经网络的海表温度预测方法


[0001]本专利技术涉及深度学习

时空序列预测和大气海洋领域,具体涉及一种融合深度学习模型的海表温度预测方法


技术介绍

[0002]海表温度是大气海洋领域中一个重要的气候指标,对于气候变化研究

海洋生态系统保护以及天气灾害预警等具有重要的意义

然而,海表温度的预测一直是一个具有挑战性的任务,因为海洋环流

季节变化和长期趋势等因素都对海表温度产生复杂而非线性的影响

传统的海表温度预测方法主要基于物理模型和统计方法,这些方法依赖于对海洋环流

温度传输过程和海洋动力学等复杂机制的理解

然而,由于海洋系统的复杂性和不确定性,传统方法在预测精度和稳定性方面存在一定的局限性

[0003]近年来,随着深度学习和时空序列预测方法的发展,融合深度学习模型的海表温度预测方法逐渐引起了研究者的关注

深度学习模型可以通过多层次的神经网络结构自动学习复杂的空间和时间依赖关系,能够更好地捕捉海洋环流

季节变化和长期趋势等因素对海表温度的影响

而时空序列预测方法则可以考虑海洋表面温度的时空分布特征,提高预测的准确性和可靠性


技术实现思路

[0004]本专利技术的融合时空粒度上下文神经网络的海表温度预测方法的提出,旨在结合深度学习的强大建模能力和时空序列预测的特点,以改善传统方法在海表温度预测中的不足

通过融合多个深度学习模型,可以利用它们各自的优势,提高预测的准确性和稳定性

这种方法在海洋气候学

海洋资源开发和环境保护等领域具有广泛的应用前景,为更好地理解和预测海洋系统的变化提供了新的途径

海表温度的预测一直是一个具有挑战性的任务,传统方法在预测精度和稳定性方面存在局限性

为了解决这些技术问题,本专利技术提出了一种新的预测模型,用来根据已有的海表温度数据预测海表温度

[0005]本专利技术的融合时空粒度上下文神经网络的海表温度预测方法,首先,在循环神经网络
RNN
模型中将细粒度卷积长短期记忆
ST

GCFN
模型作为
RNN
的细胞单元,构成预测模型;然后,训练预测模型;最后,用训练好的模型把新的海表温度数据作为模型的输入,模型的输出即为预测的海表温度

[0006]本专利技术,通过引入通道空间注意力模块
(CBAM)
,能够综合利用通道和空间的信息,提升特征的表达能力和预测性能
。CBAM
的设计允许逐层融合和残差连接,促进信息的流动和梯度的传播

[0007]同时,为了提取时空变化的特征细节并改善隐藏状态之间的相关性,本专利技术将
CBAM
模块嵌入到细粒度上下文提取器
(FGCE)
模块中

[0008]ST

GCFN
模型结合了
FGCE
模块与卷积长短期记忆模型
(ConvLSTM)
,能够充分利用多层次的神经网络结构和注意力权重图的融合,以更好地捕捉海洋系统的时空演变

该方
法在海洋气候学

海洋资源开发和环境保护等领域具有广泛的应用前景,为更好地理解和预测海洋系统的变化提供了新的途径

[0009]本专利技术的海表温度预测方法,通过引入通道空间注意力模块和细粒度上下文提取器的预测模型,能够综合利用通道和空间的信息,提升特征的表达能力和预测性能

这种方法能够更好地捕捉海洋环流

季节变化和长期趋势等因素对海表温度的影响,并提取重要的特征细节

通过
FGCE
模块与
ConvLSTM
的结合,可以更好地建模海表温度的时空演变

该方法在海洋气候学

海洋资源开发和环境保护等领域具有广泛的应用前景,为相关领域的研究和应用带来了重要的推动作用

附图说明
[0010]图1是
CBAM
模块中的第一个过程的示意图;
[0011]图2是
CBAM
模块中的第二个过程的示意图;
[0012]图3是
CBAM
模块的整体示意图;
[0013]图4是
FGCE
模块的示意图;
[0014]图5是
ST

GCFN
模型的示意图;
[0015]图6是预测模型的示意图;
[0016]图7是实施例所的海表温度预测方法的流程图

具体实施方式
[0017]为了更好地理解本专利技术的技术方案,下面将详细描述本专利技术的实施例,并结合附图进行说明

[0018]本专利技术将整个数据集分为训练

验证集和测试三部分

这种分割数据的做法是为了有效评估深度神经网络模型的性能和泛化能力

较优的,首先,选择约
70
%的数据集用于深度神经网络模型的训练

在每次训练迭代结束后,选取约
10
%的数据集对模型进行验证,并保存表现最佳的模型

最后,利用剩余约
20
%的数据集对训练好的神经网络模型进行测试,评估其检测性能

[0019]在训练阶段,首先选取部分特征数据集,这些特征可能是对问题或任务最相关的;然后,使用这些特征数据集来训练深度神经网络模型

训练的目标是通过调整模型的权重和参数,使其能够学习数据集中的特征和模式,从而对未见过的数据进行准确的预测

[0020]在验证阶段,在每一轮训练完成后,都会利用验证集对训练得到的深度神经网络模型进行验证

验证集是从整个数据集中独立出来的一部分数据,它没有用于模型的训练过程,而是用来评估模型的性能和调整超参数

通过在验证集上进行验证,可以及时检测到模型是否出现了过拟合或欠拟合等问题

在验证过程中,会记录并保存效果最好的网络模型参数

这样做的目的是为了找到在验证集上表现最佳的模型,以便在后续的测试阶段使用

通过保存最佳模型的参数,可以确保在模型应用于新数据时获得最佳的预测性能

一旦完成了模型的训练和验证,就可以使用训练好的网络模型对剩余的数据集
(
被称为测试集
)
进行检测

...

【技术保护点】

【技术特征摘要】
1.
一种融合时空粒度上下文神经网络的海表温度预测方法,其特征是首先,在循环神经网络
RNN
模型中将细粒度卷积长短期记忆
ST

GCFN
模型作为
RNN
的细胞单元,构成预测模型;然后,训练预测模型;最后,用训练好的模型把新的海表温度数据作为模型的输入,模型的输出即为预测的海表温度;海表温度数据在
ST

GCFN
模型中的处理步骤包括:
1)
将的当前时刻海表温度观测值
x
t
输入
ST

GCFN
模型中;
ST

GCFN
模型结合了
FGCE
模块与卷积长短期记忆模型
ConvLSTM

2)x
t
与前一时刻的隐藏状态
H
t
‑1输入到细粒度上下文提取器
FGCE
模块中,经处理分别得到充满时空变化细节的和和
3)
将和分别经过卷积操作,进一步提取它们各自的空间特征,并将所生成的空间特征进行拼接合并操作,获取海表温度数据的历史隐藏信息和此刻输入数据的重要特征的融合特征;
4)
沿着通道维度,对步骤
3)
得到的融合特征进行分割,分别形成遗忘门
f
t

输入门
i
t

控制门
g
t
和输出门
o
t
;遗忘门
f
t
控制了前一时刻的记忆单元
C
t
‑1中哪些信息应该被遗忘;遗忘门接收前一时刻的隐藏状态
H
t
‑1和当前时刻的输入
x
t
作为输入,经过一个
sigmoid
激活函数,输出的值在0到1之间,表示每个记忆单元元素的保留程度,值为1的元素表示完全保留,值为0的元素表示完全遗忘;输入门
i
t
控制了当前时刻的输入
x
t
和前一时刻的隐藏状态
H
t
‑1对于记忆单元的更新的影响;输入门通过一个
sigmoid
激活函数决定应该更新哪些元素,并使用
tanh
激活函数计算一个候选记忆单元
C
t
;输入门的输出和候选记忆单元的元素逐元素相乘,以控制哪些信息会被写入记忆单元;控制门
g
t
结合了输入门
i
t
的输出和候选记忆单元
C
t
,用于更新记忆单元
C
t
;控制门通过逐元素相加的方式将输入门的输出与候选记忆单元相乘的结果进行组合;控制门通过
tanh
激活函数将结果映射到
‑1到1的范围内,并将其与遗忘门的输出相乘,以控制记忆单元的更新;输出门
O
t
控制了当前时刻的隐藏状态
H
t
的哪些信息应该传递给下一个时间步或最终的输出;输出门接收前一时刻的隐藏状态
H
t
‑1、
当前时刻的输入
x
t
和更新后的记忆单元
C
t
作为输入,经过
sigmoid
激活函数输出一个值在0到1之间的向量;通过将隐藏状态
H
t
与输出门的输出相乘,并经过
tanh
激活函数映射,得到最终的隐藏状态
H
t
;步骤
2)
中,
FGCE
模块嵌有
CBAM
模块,在
FGCE
模块中:首先,由
CBAM
模块对隐藏状态<...

【专利技术属性】
技术研发人员:史本云郝英建
申请(专利权)人:南京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1