一种预测热带气旋轨迹的方法及计算机设备和存储介质技术

技术编号:34800223 阅读:18 留言:0更新日期:2022-09-03 20:06
本发明专利技术提出一种预测热带气旋轨迹的方法及计算机设备和存储介质,该方法包括:收集当前热带气旋的统计信息,进行预处理和特征工程后得到统计特征和轨迹特征,将特征输入至预先训练好的LightGBM模型,可以对未来的热带气旋轨迹位置进行预测。该方法充分利用了与热带气旋轨迹预测相关的统计信息,从中挖掘出统计特征和轨迹特征,从而充分反映热带气旋的轨迹变化;使用LightGBM模型建模预测,不需要对数据归一化,并且预测精度更高;在几秒内可以得到预测结果,速度快,可以在专业预报结果下达前供相关人员进行参考。供相关人员进行参考。供相关人员进行参考。

【技术实现步骤摘要】
一种预测热带气旋轨迹的方法及计算机设备和存储介质


[0001]本专利技术属于气象科学防灾减灾和气象预测
,具体涉及一种预测热带气旋轨迹的方法及计算机设备和存储介质。

技术介绍

[0002][0003]现今对于热带气旋轨迹预测的主流方法是基于动力学模型驱动的方法,该方法较为成熟,能够取得较好的预测效果,但是需要消耗巨大的计算资源和时间。由于近年来对热带气旋的观测技术的不断发展,积累了大量的观测数据,使得基于统计学模型驱动的方法也越来越受到关注,现今的多数研究集中在新模型的应用中,但缺少对如何提取有效特征的分析,如何从海量的数据中挖掘与热带气旋轨迹预测相关的信息,并使用合适的模型进行建模预测是一个值得研究的问题。

技术实现思路

[0004]为解决现有技术存在的问题,本专利技术提出一种预测热带气旋轨迹的方法,该方法包括:
[0005]步骤1:收集热带气旋的统计信息;
[0006]步骤2:进行预处理和特征工程,得到统计特征和轨迹特征;
[0007]步骤3:将特征输入至统计模型,对未来的热带气旋轨迹位置进行预测。
[0008]作为上述系统的一种改进,所述热带气旋的统计信息包括热带气旋发生时间、经度位置、纬度位置、发生区域、风速、压强、和到陆地距离。
[0009]作为上述系统的一种改进,所述预处理和特征工程包括对缺失值填充、提取时间特征、划分风速等级和对类别数据进行数字化编码操作;
[0010]所述对缺失值填充:指对压强等统计信息如果出现缺失值则用一个没有出现过的值进行填充;
[0011]所述提取时间特征:指根据热带气旋发生时间,提取出发生月份,发生天数以及发生小时数三个特征;
[0012]所述划分风速等级:指按照萨菲尔

辛普森飓风等级划分风速,得到风速等级;
[0013]所述对类别特征进行数字化编码:指将统计信息中的类别信息转化为数字。
[0014]作为上述系统的一种改进,所述统计特征包括当前热带气旋记录的经度位置、纬度位置、风速等级、风速、压强、发生区域、距陆地距离、发生月份、发生天数和发生小时数。
[0015]作为上述系统的一种改进,所述轨迹特征包括当前热带气旋记录的之前的经纬度间隔特征。
[0016]作为上述系统的一种改进,所述轨迹特征是以3小时为间隔当前热带气旋记录的之前的经纬度间隔特征;分别为前3时至当前的经度间隔和纬度间隔,前6时至前3时的经度间隔和纬度间隔,前9时至前6时的经度间隔和纬度间隔,前12时至前9时的经度间隔和纬度
间隔。
[0017]作为上述系统的一种改进,所述统计模型为LightGBM模型;包括第一LightGBM 模型和第二LightGBM模型,分别对未来24时的经度位置和纬度位置进行预测;方法是预测当前时刻至未来24时的经纬度间隔,假设当前时刻经纬度为lon1、lat1, 24时后的经纬度为lon2、lat2,则经纬度间隔Δlon,Δlat定义为:
[0018][0019]在得到预测间隔后,结合当前经纬度坐标,可以得到预测的未来24时的经纬度坐标。
[0020]作为上述系统的一种改进,LightGBM模型的训练方法为:利用收集到的热带气旋最佳轨迹数据,将每一个热带气旋的每一个点作为一条数据,得到统计特征和轨迹特征,划分出训练数据,验证数据和测试数据,将训练数据传入LightGBM模型对模型进行训练,同时使用验证数据验证模型的训练效果,当验证集的损失不再下降时,训练结束;其中损失函数Loss的计算表达式为:
[0021][0022]其中,m为数据的数量,y
i
表示真实的经度或者纬度间隔,表示预测的经度或者纬度间隔。
[0023]本专利技术还提供一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一项所述的方法。
[0024]本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如上述任一项所述的方法。与现有技术相比,本专利技术的优势在于:
[0025]1、本专利技术的方法充分利用了与热带气旋轨迹预测相关的统计信息,从中挖掘出统计特征和轨迹特征,从而充分反映热带气旋的轨迹变化。
[0026]2、本专利技术的方法使用了LightGBM模型建模预测,不需要对数据归一化,并且预测精度更高。
[0027]3、本专利技术的方法在几秒内可以得到预测结果,速度快,可以在专业预报结果下达前供相关人员进行参考。
附图说明
[0028]图1是本专利技术的一种预测热带气旋轨迹的方法的流程图;
[0029]图2是本专利技术的轨迹特征提取的示意图。
具体实施方式
[0030]下面结合附图对本专利技术的技术方案进行详细的说明。
[0031]本专利技术提出了一种预测热带气旋轨迹的方法及计算机设备和存储介质,如图1所
示,该方法包括:收集热带气旋的统计信息,进行预处理和特征工程,得到统计特征和轨迹特征,将特征输入统计模型,可以对未来的热带气旋轨迹位置进行预测。
[0032]热带气旋的统计信息包括热带气旋发生时间、经度位置、纬度位置、发生区域、风速、压强和到陆地距离。
[0033]预处理和特征工程包括对缺失值填充、提取时间特征、划分风速等级和对类别数据进行数字化编码操作。
[0034]对缺失值填充:指对压强等统计信息如果出现缺失值则用一个没有出现过的值进行填充,如

1000。
[0035]提取时间特征:指根据热带气旋发生时间,提取出发生月份,发生天数以及发生小时数三个特征。
[0036]划分风速等级:指按照萨菲尔

辛普森飓风等级划分风速,得到风速等级。
[0037]对类别特征进行数字化编码:指将统计信息中的类别信息转化为数字。
[0038]统计特征包括当前热带气旋记录的经度位置、纬度位置、风速等级、风速、压强、发生区域、距陆地距离、发生月份、发生天数和发生小时数。
[0039]轨迹特征包括当前热带气旋记录的之前的经纬度间隔特征,以3小时为间隔,分别为前3时至当前的经度间隔和纬度间隔,前6时至前3时的经度间隔和纬度间隔,前9时至前6时的经度间隔和纬度间隔,前12时至前9时的经度间隔和纬度间隔。
[0040]本实施例统计模型采用LightGBM模型,包括第一LightGBM模型和第二 LightGBM模型,分别对未来24时的经度位置和纬度位置进行预测。方法是预测当前时刻至未来24时的经纬度间隔,假设当前时刻经纬度为lon1,lat1,24时后的经纬度为lon2,lat2,则经纬度间隔Δlon,Δlat定义为:
[0041][0042]在得到预测间隔后,结合当前经纬度坐标,可以得到预测的未来24时的经纬度坐标。
[0043]两个LightGBM模型的训练方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预测热带气旋轨迹的方法,其特征在于,该方法包括:步骤(1):收集热带气旋的统计信息;步骤(2):进行预处理和特征工程,得到统计特征和轨迹特征;步骤(3):将特征输入至统计模型,对未来的热带气旋轨迹位置进行预测。2.根据权利要求1所述的一种预测热带气旋轨迹的方法,其特征在于,所述热带气旋的统计信息包括热带气旋发生时间、经度位置、纬度位置、发生区域、风速、压强、和到陆地距离。3.根据权利要求1所述的一种预测热带气旋轨迹的方法,其特征在于,所述预处理和特征工程包括对缺失值填充、提取时间特征、划分风速等级和对类别数据进行数字化编码操作;所述对缺失值填充:指对压强等统计信息如果出现缺失值则用一个没有出现过的值进行填充;所述提取时间特征:指根据热带气旋发生时间,提取出发生月份,发生天数以及发生小时数三个特征;所述划分风速等级:指按照萨菲尔

辛普森飓风等级划分风速,得到风速等级;所述对类别特征进行数字化编码:指将统计信息中的类别信息转化为数字。4.根据权利要求1所述的一种预测热带气旋轨迹的方法,其特征在于,所述统计特征包括当前热带气旋记录的经度位置、纬度位置、风速等级、风速、压强、发生区域、距陆地距离、发生月份、发生天数和发生小时数。5.根据权利要求1所述的一种预测热带气旋轨迹的方法,其特征在于,所述轨迹特征包括当前热带气旋记录的之前的经纬度间隔特征。6.根据权利要求5所述的一种预测热带气旋轨迹的方法,其特征在于,所述轨迹特征是以3小时为间隔当前热带气旋记录的之前的经纬度间隔特征;分别为前3时至当前的经度间隔和纬度间隔,前6时至前3时的经度间隔...

【专利技术属性】
技术研发人员:夏传坤何杰颖张升伟
申请(专利权)人:中国科学院国家空间科学中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1