一种基于随机森林和GRU的台风路径预报方法技术

技术编号:37123645 阅读:12 留言:0更新日期:2023-04-01 05:19
本发明专利技术公开了一种基于随机森林和GRU的台风路径预报方法,包括:采用随机森林方法对训练数据进行拟合,筛选重要特征,重构训练数据集;通过训练数据集对GRU神经网络进行训练,获取满足精度要求的GRU神经网络;通过GRU神经网络预测台风路径。本发明专利技术能够快速的预测台风路径,并提高了预测的准确度。并提高了预测的准确度。并提高了预测的准确度。

【技术实现步骤摘要】
一种基于随机森林和GRU的台风路径预报方法


[0001]本专利技术涉及机器学习和台风路径预测,具体涉及一种基于随机森林和GRU的台风路径预报方法。

技术介绍

[0002]西北太平洋是全球热带气旋最活跃的海域,该海域每年生成的热带气旋频数约占全球总频数的1/3以上。而我国处在太平洋的西侧,有18000km以上的海岸线,是世界上受热带气旋影响最严重的国家之一。台风是一种暖核的大型气旋,往往伴随着强风,强降水和风暴潮,并引发严重灾害,对人们的生命、财产安全和沿海地区的经济发展构成严重威胁。由于台风灾害的不可抗性和潜在的破坏性,提前准确地预测台风的移动可以为受灾地区提供充足的时间做好防灾工作。
[0003]目前,台风路径的预报方法主要分为两类。主流方法是数值模式预报,该模式通过微分方程模拟台风路径类型的变化过程,并用超级计算机进行计算和求解。主要的数值模型包括GRAPES

TYM(CMA),GEFS(NCEP)和IFS(ECWMF)。同时,集合预报模式(GRAPES

GEFS,ECMWF

EPS,NCEP

GEFS)的提出可以减少各种不确定性对数值预测结果的影响。另一种方法是统计方法,主要基于回归技术,利用台风路径与其相关因子之间的回归方程来解决预报问题。气候与持续预报方法即CLIPER(Climatology and Persistence)方法是国内外应用最广泛应用的方法之一,取台风运动的气候规律与初始时刻持续性特征作为因子,用来预报大西洋飓风路径。虽然目前数值预报可以提供精准的结果,但它需要大量的时间和资源来处理复杂的动力学方程。而传统的台风统计方法大多采用线性回归方法建模,对于台风路径预报这种强非线性问题难以预测出准确的结果。
[0004]深度学习是基于神经网络算法从样本数据中获取非线性和复杂关系的统计模型,神经网络预测方法通过模仿动物神经网络的结构特点,以大量历史数据为实验依据,在反复训练下自动调整网络节点之间的权重因子,具有适应能力强、容错能力强的优势。台风路径预报是非线性问题,台风具有复杂的动力机制,易受环境转向流、Beta效应、下垫面条件、内核非对称结构、中尺度环流等多种因素的影响。人工神经网络由于其较强的学习能力和模拟非线性系统方面的优势,已被应用于预测热带气旋路径。直到2010年代,人工神经网络(ANN)和前馈神经网络(BP)网络一直是预测热带气旋强度和路径的主流神经网络方法,自2010年代中期以来,由于深度学习的发展,更多新方法被引入到热带气旋预报中。

技术实现思路

[0005]本专利技术的目的在于提供一种基于随机森林和GRU的台风路径预报方法,能够快速的预测台风路径,并提高了预测的准确度。
[0006]实现本专利技术目的的技术解决方案为:一种基于随机森林和GRU的台风路径预报方法,包括:
[0007]采用随机森林方法对训练数据进行拟合,筛选重要特征,重构训练数据集;
[0008]通过训练数据集对GRU神经网络进行训练,获取满足精度要求的GRU神经网络;
[0009]通过GRU神经网络预测台风路径。
[0010]进一步地,所述随机森林方法包含N个决策树,决策树生成过程采用boostrap。
[0011]进一步地,所述随机森林方法筛选重要特征包括:
[0012]选择袋外数据,计算袋外数据误差error:
[0013][0014]其中,f
i
为预测值,y
i
为实际值,n为样本数;
[0015]随机对袋外数据所有样本的特征加入噪声干扰,再次计算袋外数据误差error
m

[0016][0017]其中,为对特征m加入噪声后的预测值;
[0018]基于袋外数据误差和加入噪声干扰的袋外数据误差计算所有特征的重要性I;
[0019][0020]其中,N为决策树的数目,error
j
为第j个决策树的袋外数据误差,为第j个决策树加入噪声后的袋外数据误差;
[0021]重复上述三个步骤,计算所有特征重要性,按照特征重要性的排序,依次删除重要性小于阈值的特征。
[0022]进一步地,重构训练数据集时对数据进行归一化处理:
[0023][0024]其中,x为原始数据,x

为归一化后数值,x
max
和x
min
分别为变量x的最大值和最小值。
[0025]进一步地,所述GRU神经网络使用过去24h的路径数据,预测台风路径为未来6

72h的台风移动路径
[0026]进一步地,所述GRU神经网络包括输入层、隐藏层和输出层,输入层是一个二维的向量,分别是特征维与时间维,隐藏层由多个门控循环细胞组成,输出层有24个神经元,即输出序列中每个元素的维数为24,网络初始参数为0到1之间的随机数,将预报和真实位置之间的均方根误差作为损失函数。
[0027]进一步地,所述隐藏层通过重置门r
t
和更新门z
t
来控制信息流,重置门r
t
用于控制从上一个隐藏层h
t
‑1到当前候选隐藏层保留的信息量,即:
[0028]r
t
=σ(W
r
·
[h
t
‑1,x
t
])
[0029][0030]其中x
t
是当前时刻的输入值,w是权重系数,σ是sigmoid函数,tanh是双曲正切函数。
[0031]进一步地,所述更新门z
t
控制需要从上一个隐藏层h
t
‑1中忘记多少信息:
[0032]进一步地,所述当前隐藏层h
t
由更新门z
t
、上一个隐藏层h
t
‑1和当前候选隐藏层h
t
确定:
[0033][0034]与现有技术相比,本专利技术的有益效果在于:本专利技术利用随机森林方法筛选重要特征,并通过GRU层从时间序列数据集中提取台风历史数据的深层非线性和复杂时间特征,当一个新的热带气旋从海上生成时,可以在几秒内快速地给出未来台风移动路径的预测结果,提高了预测速度;同时,可以更好地预报出台风的中长期路径,提高了预测的准确度。
附图说明
[0035]图1为本专利技术中GRU的结构图。
[0036]图2为本专利技术的台风路径预测方法流程图。
[0037]图3为基于随机森林方法判断各个特征的重要性程度示意图。
[0038]图4为不同特征组合对应的袋外数据(OOB)的评分示意图。
[0039]图5为GRU神经网络预测的所有测试样本的经纬度与实际情况的对比图,图5中的(a)、(c)、(e)、(g)、(i)分别为6h、12h、24h、48h、72h的经度预测结果图,图5中的(b)、(d本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于随机森林和GRU的台风路径预报方法,其特征在于,包括:采用随机森林方法对训练数据进行拟合,筛选重要特征,重构训练数据集;通过训练数据集对GRU神经网络进行训练,获取满足精度要求的GRU神经网络;通过GRU神经网络预测台风路径。2.根据权利要求1所述的一种基于随机森林和GRU的台风路径预报方法,其特征在于,所述随机森林方法包含N个决策树,决策树生成过程采用boostrap。3.根据权利要求2所述的一种基于随机森林和GRU的台风路径预报方法,其特征在于,所述随机森林方法筛选重要特征包括:选择袋外数据,计算袋外数据误差error:其中,f
i
为预测值,y
i
为实际值,n为样本数;随机对袋外数据所有样本的特征加入噪声干扰,再次计算袋外数据误差error
m
:其中,f
im
为对特征m加入噪声后的预测值;基于袋外数据误差和加入噪声干扰的袋外数据误差计算所有特征的重要性I;其中,N为决策树的数目,error
j
为第j个决策树的袋外数据误差,为第j个决策树加入噪声后的袋外数据误差;重复上述三个步骤,计算所有特征重要性,按照特征重要性的排序,依次删除重要性小于阈值的特征。4.根据权利要求2所述的一种基于随机森林和GRU的台风路径预报方法,其特征在于,所述N=100。5.根据权利要求1所述的一种基于随机森林和GRU的台风路径预报方法,其特征在于,重构训练数据集时对数据进行归一化处理:其中,x为原始数据,x

为归一化后数值,x
max
和x
min
分别为变量x的最大值和最小值。6.根据权利要求1所述的一种基于随机森林和GRU的台风路径预报方法,其特征在于,所述GRU神经网络使用过去24h的路径数据,预测台风路径为未来6<...

【专利技术属性】
技术研发人员:张建彬王靓万秉成周少辉高志球
申请(专利权)人:中国人民解放军三二零二七部队
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1