System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种利用注意力机制改进的热带气旋路径预报方法技术_技高网

一种利用注意力机制改进的热带气旋路径预报方法技术

技术编号:40493567 阅读:14 留言:0更新日期:2024-02-26 19:23
本发明专利技术公开了一种利用注意力机制改进的热带气旋路径预报方法,涉及海洋气象预报技术领域,利用Deep⨯框架融合热带气旋的二维特征和热带气旋及其周边的三维特征,构建端到端的模型;对于Cross分量,通过特征交叉的方法来提取热带气旋的二维特征;对于Deep分量,使用基于卷积注意力模块CBAM的Multi‑TrajGRU方法提取热带气旋及其周边的三维特征,其中卷积注意力模块CBAM能够对热带气旋的三维结构进行建模,并解决热带气旋受等压面影响以及三维结构的大尺度问题,Multi‑TrajGRU模型的使用则为了解决大气再分析数据特征提取不充分的问题,从而提高热带气旋路径预报的精度。

【技术实现步骤摘要】

本专利技术涉及海洋气象预报,特别是涉及一种利用注意力机制改进的热带气旋路径预报方法


技术介绍

1、传统的热带气旋轨迹预报方法主要分为三类,第一种是数值预报方法,是目前热带气旋客观预报所采用的主要方法,该预报方法使用数学建模的方式来预报未来热带气旋的路径与强度,由于这些动力学方程过于复杂,因此需要借助超级计算机解出其数值以完成预报;第二种是基于统计学的预报方法,是根据数理统计方法对大量的历史资料进行统计分析,找出天气变化隐藏的统计规律及预报量之间的方程关系,一般采用回归方法建立统计数学模型,与动力学预报方法相比,该方法具有计算资源消耗少的特点;第三种是基于统计动力学的预报方法,该方法将动力学与统计学相结合,原理是利用数值预报的方法求解大气运动方程,得到方程的数值解后作出数值预报,最后再利用统计方法对预报的结果进行加工得出天气的预报结果。

2、早期对统计方法的研究主要集中在提取热带气旋的二维特征,如热带气旋中心的纬度、经度、风速和压力等特征,1972年neumann和hope提出了气候学和持久性方法(climatology and persistence,cliper),该方法使用当前风暴位置、风暴运动、最大持续风速和之前风暴运动记录作为预报因子,推导出线性回归方程,生成长达3天的风暴轨迹;因为cliper具有计算简单、模型稳定、误差友好等特点,使得cliper成为热带气旋的路径与强度预报方法的基线模型。

3、随着海洋和大气数据量的不断积累,将深度学习模型与气象大数据相结合,为研究人员预报热带气旋轨迹提供了新的机会,在最近的一些研究中,深度学习被用来提取热带气旋的二维和三维特征。热带气旋的三维特征指的是具有等压高度的再分析数据,以热带气旋中心为中心构建出来的三维(经度,纬度,海拔)立体特征。

4、alemany等学者利用long short-term memory(lstm)模型来构建热带气旋的二维非线性特征,该工作将大西洋区域划分为1°×1°的经纬度网格并对之编号,再将热带气旋的每段路径中心的经纬度归类到相应的格点中,该工作能够有效减少直接预报带来的递归误差传递。

5、为了模拟热带气旋的三维特征,许多深度学习的方法也被提了出来,kim等学者利用shi等学者提出的convlutionallstm(convlstm)模型,结合大气再分析数据,实现了跟踪和预报大尺度气候数据中的飓风轨迹。该工作首次将热带气旋的三维特征以时空序列的方式进行处理。然而,由于大气再分析规模较大,仅通过一次cnn操作很难提取热带气旋三维空间的非线性特征。

6、sophie等学者使用深度学习模型融合热带气旋的二维和三维特征。对于二维模型,作者使用全连接网络来提取热带气旋的二维非线性特征,对于三维模型,作者使用cnn来提取热带气旋的三维非线性特征。然而,cnn模型仅仅只考虑了等压面,无法充分考虑热带气旋的三维结构。

7、chen等学者提出cnn-lstm模型来预报热带气旋的路径,该模型在的3d cnn用来分析三维空间中的大气变量,2d cnn用于分析海面的数据,lstm则用来捕捉时间相关性,该模型关注了大气和海洋变量间的时空相关性,但是3d cnn在分析大气特征方面仍有不足。

8、通过分析目前热带气旋路径预报方法的优势与不足,本专利技术通过改进下面两个方面来提高预报的精度,首先该模型需要能够提取热带气旋的三维特征;其次该模型能够采用更好的方法来融合热带气旋的二维和三维特征。


技术实现思路

1、为了解决以上技术问题,本专利技术提供一种利用注意力机制改进的热带气旋路径预报方法,包括以下步骤

2、s1、构建热带气旋的二维结构;

3、s2、构建热带气旋及其周边的三维时序结构;

4、s3、通过基于卷积注意力模块的多卷积multi-trajgru模型对热带气旋的三维结构进行建模,并提取热带气旋及其周边的三维时序特征;

5、s4、通过deep&cross特征融合框架对热带气旋的二维时序特征与热带气旋及其周边的三维时序特征进行异构模态融合,deep&cross特征融合框架包括用于泛化存档数据的深度网络和用于记忆学习数据的交叉网络,深度网络设置为一个全连接的前馈神经网,交叉网络包括多个交叉层;

6、s5、通过deep&cross特征融合框架对热带气旋的二维时序特征与热带气旋及其周边的三维时序特征进行融合训练,得到热带气旋24小时后的预报点,即经度和维度的预报值;

7、s6、判断预报点是否精确,如果不精确,则返回步骤s3;如果精确,则执行下一步骤;

8、s7、保存模型。

9、本专利技术进一步限定的技术方案是:

10、进一步的,步骤s1中,使用cma最佳路径数据集,通过cliper方法构建热带气旋的二维结构。

11、前所述的一种利用注意力机制改进的热带气旋路径预报方法,步骤s2中,使用ecmwf大气再分析数据构建热带气旋及其周边的三维时序结构。

12、前所述的一种利用注意力机制改进的热带气旋路径预报方法,步骤s2中,采用ecmwf的ear-interim数据集的重力势变量构建热带气旋及其周边的三维时序结构,包括以下步骤

13、s2.1、以热带气旋中心的纬度和经度为中心,截取一个范围为31°×31°的曲面,同时为每个等压面构建热带气旋的二维结构;

14、s2.2、使用热带气旋的二维结构,将250hpa、500hpa、750hpa以及1000hpa这4个等压面合并,获得热带气旋及其周边的三维时序结构;

15、s2.3、构建当前、6小时前、12小时前以及18小时前的热带气旋及其周边的三维时序结构。

16、前所述的一种利用注意力机制改进的热带气旋路径预报方法,步骤s3中,多卷积multi-trajgru模型的方程如下所示:

17、ut,vt=γ(xt,ht)

18、

19、

20、

21、

22、其中,ht、zt以及rt分别表示记忆门、重置门以及更新门;h′t表示新的信息;表示输入,h和w表示状态和输入张量的高度和宽度;ut和vt是存储由结构生成网络生成的局部连接的流场;ci表示输入张量的通道大小;σ为sigmoid函数,tanh为双曲正切函数,*为卷积运算,°为哈达玛乘积,γi(xt)=w1*…*wi*xt为多卷积模块。

23、前所述的一种利用注意力机制改进的热带气旋路径预报方法,步骤s3中,卷积注意力模块包括通道注意力模块和空间注意力模块,通道注意力模块用于通过学习不同通道的特征来关注不同通道之间的相关性;空间注意力模块用于捕获特征图中不同像素位置之间的空间相关性。

24、前所述的一种利用注意力机制改进的热带气旋路径预报方法,步骤s4中,deep&cross特征融合框架包括嵌入和堆叠层、交叉网络、深度本文档来自技高网...

【技术保护点】

1.一种利用注意力机制改进的热带气旋路径预报方法,其特征在于:包括以下步骤

2.根据权利要求1所述的一种利用注意力机制改进的热带气旋路径预报方法,其特征在于:所述步骤S1中,使用CMA最佳路径数据集,通过CLIPER方法构建热带气旋的二维结构。

3.根据权利要求1所述的一种利用注意力机制改进的热带气旋路径预报方法,其特征在于:所述步骤S2中,使用ECMWF大气再分析数据构建热带气旋及其周边的三维时序结构。

4.根据权利要求3所述的一种利用注意力机制改进的热带气旋路径预报方法,其特征在于:所述步骤S2中,采用ECMWF的EAR-Interim数据集的重力势变量构建热带气旋及其周边的三维时序结构,包括以下步骤

5.根据权利要求1所述的一种利用注意力机制改进的热带气旋路径预报方法,其特征在于:所述步骤S3中,多卷积Multi-TrajGRU模型的方程如下所示:

6.根据权利要求1所述的一种利用注意力机制改进的热带气旋路径预报方法,其特征在于:所述步骤S3中,卷积注意力模块包括通道注意力模块和空间注意力模块,通道注意力模块用于通过学习不同通道的特征来关注不同通道之间的相关性;空间注意力模块用于捕获特征图中不同像素位置之间的空间相关性。

7.根据权利要求1所述的一种利用注意力机制改进的热带气旋路径预报方法,其特征在于:所述步骤S4中,Deep&Cross特征融合框架包括嵌入和堆叠层、交叉网络、深度网络以及最终组合层,最终组合层用于将交叉网络和深度网络的输出进行融合;

8.根据权利要求7所述的一种利用注意力机制改进的热带气旋路径预报方法,其特征在于:所述交叉网络由多个交叉层表示,假设第l层的输出向量为xl,那么对于第l+1层,输出的向量xl+1如下式所示:

9.根据权利要求7所述的一种利用注意力机制改进的热带气旋路径预报方法,其特征在于:所述深度网络设置为一个全连接的前馈神经网,每一层有如下公式:

10.根据权利要求1所述的一种,其特征在于:所述步骤S6中,利用下式所示的大圆距离公式来计算球面上地面真实点和预报点之间的误差距离:

...

【技术特征摘要】

1.一种利用注意力机制改进的热带气旋路径预报方法,其特征在于:包括以下步骤

2.根据权利要求1所述的一种利用注意力机制改进的热带气旋路径预报方法,其特征在于:所述步骤s1中,使用cma最佳路径数据集,通过cliper方法构建热带气旋的二维结构。

3.根据权利要求1所述的一种利用注意力机制改进的热带气旋路径预报方法,其特征在于:所述步骤s2中,使用ecmwf大气再分析数据构建热带气旋及其周边的三维时序结构。

4.根据权利要求3所述的一种利用注意力机制改进的热带气旋路径预报方法,其特征在于:所述步骤s2中,采用ecmwf的ear-interim数据集的重力势变量构建热带气旋及其周边的三维时序结构,包括以下步骤

5.根据权利要求1所述的一种利用注意力机制改进的热带气旋路径预报方法,其特征在于:所述步骤s3中,多卷积multi-trajgru模型的方程如下所示:

6.根据权利要求1所述的一种利用注意力机制改进的热带气旋路径预报方法,其特征在于:所述步骤s3中,卷积注意...

【专利技术属性】
技术研发人员:方巍陆文赫李佳欣
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1