【技术实现步骤摘要】
基于迁移学习的不平衡数据条件下强台风形成预测方法
[0001]本申请涉及计算机和气象、海洋的交叉
,特别是涉及一种基于迁移学习的不平衡数据条件下强台风形成预测方法。
技术介绍
[0002]台风作为一种强度大于64kt的热带气旋,是一种中心气压很低,低层有气流显著向中心辐合,顶部气流主要向外辐散的低气压系统。热带气旋(包括强台风)是气象海洋学中灾害严重的高影响天气现象。近年来,强台风等极端天气气候事件越来越频繁,不仅给沿海地区造成巨大的经济损失,也极大地危及人们的生命财产安全。
[0003]为了减轻强台风灾害带来的损失,最重要的方式是对强台风进行准确的预警预报,为各级政府提供决策依据,确保防台抗灾措施的有效性和及时性。因此,对强台风的准确预报是世界各大国面临的重要研究课题。现阶段,针对预测热带气旋形成的方法主要有三种:基于数值预报的方法、基于统计预报的方法和基于机器学习的方法。
[0004]基于数值预报的方法被广泛地用于世界各国的主要台风/飓风预警预报中心,为社会提供预报预警服务起到了非常重要的作用,比较 ...
【技术保护点】
【技术特征摘要】
1.一种基于迁移学习的不平衡数据条件下强台风形成预测方法,其特征在于,所述方法包括:获取官方的历史热带气旋最佳路径数据集,对所述历史热带气旋最佳路径数据集进行筛选,获取历史热带气旋最佳路径数据记录及其对应的环境变量数据集,根据所述历史热带气旋最佳路径数据记录和环境变量数据集构建用于训练强台风预学习模型的平衡数据集以及用于训练不平衡强台风样本再学习模型的不平衡数据集;构建不平衡数据条件下的强台风形成预测框架,所述强台风形成预测框架包括强台风预学习模型和不平衡强台风样本再学习模型;其中,所述强台风预学习模型包括大气三维卷积模块、海表面二维卷积模块、海洋水文三维卷积模块、第一长短期记忆网络模块以第一全连接层;所述不平衡强台风样本再学习模型包括所述强台风预学习模型中加载保存后的大气三维卷积模块、海表面二维卷积模块和海洋水文三维卷积模块以及第二长短期记忆网络模块和第二全连接层;根据所述平衡数据集和不平衡数据集对所述强台风形成预测框架进行训练,得到训练好的强台风形成预测框架;根据所述训练好的强台风形成预测框架对预测数据进行台风形成预测,得到台风形成预测结果;其中,所述强台风形成预测框架的训练步骤具体包括:将所述平衡数据集和不平衡数据集按照一定的比例划分为平衡数据训练集、平衡数据测试集以及不平衡数据训练集和不平衡数据测试集;使用二分类交叉熵损失函数、平衡数据训练集和平衡数据测试集对所述强台风预学习模型进行训练和性能评估,选择在所述平衡数据测试集上评估效果最好的强台风预学习模型作为训练好的强台风预学习模型;将所述训练好的强台风预学习模型中的先验知识迁移到所述不平衡强台风样本再学习模型中,并使用预先构建的不平衡强台风样本损失函数、不平衡数据训练集和不平衡数据测试集对所述不平衡强台风样本再学习模型进行训练和性能评估,选择在所述不平衡数据测试集上评估效果最好的不平衡强台风样本再学习模型作为训练好的不平衡强台风样本再学习模型。2.根据权利要求1所述的方法,其特征在于,获取官方的历史热带气旋最佳路径数据集,对所述历史热带气旋最佳路径数据集进行筛选,获取历史热带气旋最佳路径数据记录及其对应的环境变量数据集,包括:获取官方的历史热带气旋最佳路径数据集,根据热带气旋的形成海域对所述历史热带气旋最佳路径数据集进行划分,获取每一海域内包含不同年份的历史热带气旋最佳路径数据记录;其中,每一条历史热带气旋最佳路径数据记录包括热带气旋从形成到消亡的时间、中心经纬度位置、中心最小压强以及中心最大风速;根据所述中心最大风速将所述历史热带气旋最佳路径数据记录分为强台风样本数据集C1和普通台风样本数据集C2,并根据所述C1和C2获取对应的强台风样本环境变量数据集和普通台风样本环境变量数据集3.根据权利要求1所述的方法,其特征在于,根据所述C1和C2获取对应的强台风样本环
境变量数据集和普通台风样本环境变量数据集包括:将所述C1中的强台风记录进行随机排序,对于其中的第n
i
条强台风记录,赋予所述n
i
中强台风记录点的序号为根据第个记录点记录的时间和中心经纬度位置,从官方天气预报中心网站下载对应的大气变量数据、海表面变量数据以及海洋水文变量数据,并将下载后的大气变量数据、海表面变量数据以及海洋水文变量数据进行打包组合,构建得到强台风样本环境变量数据集为其中,表示强台风样本大气变量数据集,表示强台风样本海表面变量数据集,表示强台风样本海洋水文数据集;将所述C2中的普通台风记录进行随机排序,对于其中的第n
j
条普通台风记录,赋予所述n
j
中普通台风记录点的序号为根据第个记录点记录的时间和中心经纬度位置,从官方天气预报中心网站下载对应的大气变量数据、海表面变量数据以及海洋水文变量数据,并将下载后的大气变量数据、海表面变量数据以及海洋水文变量数据进行打包组合,构建得到普通台风样本环境变量数据集为其中,表示普通台风样本大气变量数据集,表示普通台风样本海表面变量数据集,表示普通台风样本海洋水文数据集。4.根据权利要求3所述的方法,其特征在于,根据所述历史热带气旋最佳路径数据记录和环境变量数据集构建用于训练强台风预学习模型的平衡数据集以及用于训练不平衡强台风样本再学习模型的不平衡数据集,包括:根据所述历史热带气旋最佳路径数据记录中的强台风样本数据集C1及其对应的强台风样本环境变量数据集构建用于训练强台风预学习模型的第一强台风数据集R
T1
和用于训练不平衡强台风样本再学习模型的第二强台风数据集R
T2
;根据所述历史热带气旋最佳路径数据记录中的普通台风样本数据集C2及其对应的普通台风样本环境变量数据集构建用于训练普通台风预学习模型的第一普通台风数据集R
F1
和用于训练不平衡普通台风样本再学习模型的第二普通台风数据集R
F2
;根据所述R
T1
和R
F1
构建用于训练强台风预学习模型的平衡数据集R1,根据所述R
T2
和R
F2
构建用于训练不平衡强台风样本再学习模型的不平衡数据集R2。5.根据权利要求4所述的方法,其特征在于,根据所述历史热带气旋最佳路径数据记录中的强台风样本数据集C1及其对应的强台风样本环境变量数据集构建用于训练强台风预学习模型的第一强台风数据集R
T1
和用于训练不平衡强台风样本再学习模型的第二强台风数据集R
T2
,包括:从所述C1中任选出第n
i
条强台风记录并从所述选出对应的强台风样本环境变量数据,将第n
i
条强台风记录中第一个强度大于84kt的强台风记录点编号为选定预测时间步长为k,回归时间步长为b,令k=T/6,T为预测时间且为6的正整数倍,b为1~k之间的任一正整数;
若则从挑选编号后k+b个强台风记录点,将其对应的强台风样本环境数据进行打包作为一个强台风输入样本;若样本环境数据进行打包作为一个强台风输入样本;若则对下一个强台风记录进行数据筛选;对所述C1中所有的强台风记录进行筛选后获得的所有强台风输入样本进行打包,得到针对强台风形成预测框架训练的强台风输入数据集,将所有强台风输入样本赋予标签1,得到针对强台风形成预测框架训练的强台风输出数据集;从所述强台风输入数据集和强台风输出数据集提取等量的一部分样本,组成用于训练强台风预学习模型的第一强台风数据集R
T1
,并将所述强台风输入数据集和强台风输出数据集中剩余的数据组成用于训练不平衡强台风样本再学习模型的第二强台风数据集R
T2
。6.根据权利要求5所述的方法,其特征在于,根据所述历史热带气旋最佳路径数...
【专利技术属性】
技术研发人员:汪祥,潘小天,吴建平,赵成武,王辉赞,王森章,陈思好,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。