System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及天气预报与灾害预警,具体涉及一种基于集成学习的对台风灾害预报方法及系统。
技术介绍
1、台风是我国东南沿海地区面临的主要气象灾害之一。可带来强降雨、狂风、洪涝等严重危害,对其风雨的准确的及时的预报对防灾减灾事业至关重要。
2、传统数值天气预报模型与双偏振多普勒天气雷达回波进行风场和降雨的测量与预报由于对微物理过程机理认识尚不清楚与雷达、卫星测量降水方法等存在误差,其准确性与时效性达到瓶颈,且耗费大量时间和计算资源。
3、近年来,随着人工智能技术在气象领域的应用兴起,机器学习被广泛应用于各类极端天气的预报。具体而言,通过集成学习方法,能够更全面、准确地预测台风的风雨影响。支持向量机svm的精准分类、长短时记忆神经网络lstm能够捕捉时间序列数据中的长期依赖关系的能力、极致梯度提升树xgboost所具有高效的集成学习机制和对特征的鲁棒性。进一步的,使用堆叠集成将lstm和xgboost组合在一起,可以获得更强大的整体性能为台风风雨预报提供了更高的准确性。这一集成学习模型的优势集合为提升台风风雨预报技术带来了更为显著的好处。
4、采用台风风雨预报模型,以台风路径、实况强度、副高指数、地区地理参数等要素作为输入,经过模型训练,可建立输入变量与台风风雨之间的复杂非线性关系,可用于实际台风来袭时的风雨预报,提供新型的、高效的、准确的新型预报方法,这是社会与以气象局为代表的相关部门所急需的。
技术实现思路
1、专利技术目的:本专利技术的目的是提供
2、技术方案:本专利技术所述的一种基于集成学习的对台风灾害预报方法,包括以下步骤:
3、(1)利用台风参数数据、再分析资料、地面观测数据按时间和空间匹配构建历史台风训练数据集并进行预处理;
4、(2)建立台风风雨预报模型,将历史台风训练数据集输入到台风风雨预报模型中进行训练,得到台风降水预报模型最优参数;
5、(3)评估预报结果。
6、进一步的,所述步骤(1)中,台风参数数据包括:台风中心经度、台风中心纬度、气象站台经度、气象站台纬度、气象站台海拔、台风最低气压、台风近中心最大风速;再分析资料包括:西太平洋北纬 10°以北,东经 90°至 180°以内;500 hpa高度场的位势高度和纬向风;地面观测数据包括:降水量、风速;根据上述数据的二次计算或直接采用为台风风雨预报模型所配置的参数包括:台风中心经度、台风中心纬度、气象站台经度、气象站台纬度、台风中心与气象站台之间的距离、气象站台海拔、台风最低气压、台风近中心最大风速、西太副高强度、西太副高面积、西太副高西伸脊点与西太副高脊线;台风风雨预报模型预报目标参数包括:降水量、风速。
7、进一步的,所述步骤(1)中,预处理包括:根据台风中心经度、台风中心纬度、气象站台经度和气象站台纬度计算台风中心与气象站台之间的距离:
8、;
9、其中,r 代表地球的半径;lat_sta为气象站台纬度、lat为台风中心纬度、long_sta为气象站台经度、long为台风中心经度;
10、根据西太平洋500 hpa高度场的位势高度和纬向风计算西太副高指数;西太副高指数包括:
11、西太副高面积gm,公式如下:
12、;
13、;
14、西太副高强度gq,公式如下:
15、;
16、西太副高脊线gx,公式如下:
17、;
18、西太副高西伸脊点gd,公式如下:
19、;
20、dx:纬向格距数值;
21、dy:经向格距数值;
22、i:格点纬向序号,i=1,2,……nx,nx为监测范围内的纬向格点总数,由西向东增加;
23、j:格点经向序号,j=1,2,……ny,ny为监测范围内的经向格点总数,由南向北增加;
24、:500 hpa高度场上某个格点的位势高度值;
25、:格点所在的纬度值;
26、其中,为在北纬10º以北、东经110º至东经150º范围内的500hpa高度场上的588位势什米等值线所包围的西太副高体内纬向风切变线即 所在纬度位置的平均值;若不存在588位势什米等值线,则定义584位势什米等值线内的纬向风切变线所在纬度位置的平均值;若在某月不存在584位势什米等值线,则以该月的历史最小值代替;
27、为北纬10º以北、东经90º至东经180º范围内的500hpa高度场上的588 位势什米等值线的最西格点所在位置的经度值;若最西格点在90ºe以西则统一计为90ºe;若在某月不存在588位势什米等值线,则以该月的历史最大值代替。
28、进一步的,所述步骤(2)中,建立台风风雨预报模型包括:svm模块、lstm模块和xgboost模块;具体如下:首先,使用svm进行训练,以判断受台风影响的区域;通过构建分离超平面,识别时序数据中不同区域的受影响与否情况;将svm判断的受影响区域的时序数据输入到lstm中,以高训练轮数来捕获时序数据中的长期依赖关系;然后利用 xgboost通过集成多个决策树,建立复杂的非线性关系;最后,以线性回归为元模型将lstm、xgboost的输出进行堆叠输出。
29、进一步的,所述步骤(2)中,对模型进行训练具体如下:首先,将历史训练数据集导入台风风雨预报模型后,调整模型参数确定模型最佳性能参数;其次,是利用网格搜索与十倍交叉验证方法结合确定模型最优参数;网格搜索法将遍历预先设定的参数组合,评估参数采用以下公式计算得到:
30、;
31、其中,表示参数搜索空间,是参数组合,表示使用交叉验证评估参数下模型的性能指标;求解过程就是遍历,计算每个对应的,找到最大化的即最优参数组合;
32、使用交叉验证评估每组参数的模型性能,选择出性能最优的参数组合;具体确定方法如下:将历史训练数据集分隔为训练集和验证集,得到模型对验证集的降水量与风速预测结果后,对比验证集的实际降水量与风速,计算验证集结果的评估参数:平均绝对误差、均方根误差、偏差、相关系数r、观测值的标准偏差、模拟值的标准偏差、模拟值与观测值的吻合指数 ,选取评估参数最优的参数组合作为模型超参数,上述评估参数采用以下公式计算得到:
33、;
34、;
35、;
36、;
37、;
38、;
39、;
40、其中,为第i个预测值;为第i个观测值,n为样本总数,为观测值的平均,为预测值的平均,为第i个预测值和观测值间的差值。
41、本专利技术所述的一种基于集成学习的对台风灾害预报系统,包括:
42、数据获取模块:用于利用台风参数数据、再分析资料、地面观测数据按时间和空间匹配构建本文档来自技高网...
【技术保护点】
1.一种基于集成学习的对台风灾害预报方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于集成学习的对台风灾害预报方法,其特征在于,所述步骤(1)中,台风参数数据包括:台风中心经度、台风中心纬度、气象站台经度、气象站台纬度、气象站台海拔、台风最低气压、台风近中心最大风速;再分析资料包括:西太平洋北纬10°以北,东经 90°至 180°以内;500 hPa高度场的位势高度和纬向风;地面观测数据包括:降水量、风速;根据上述数据的二次计算或直接采用为台风风雨预报模型所配置的参数包括:台风中心经度、台风中心纬度、气象站台经度、气象站台纬度、台风中心与气象站台之间的距离、气象站台海拔、台风最低气压、台风近中心最大风速、西太副高强度、西太副高面积、西太副高西伸脊点与西太副高脊线;台风风雨预报模型预报目标参数包括:降水量、风速。
3.根据权利要求1所述的一种基于集成学习的对台风灾害预报方法,其特征在于,所述步骤(1)中,预处理包括:根据台风中心经度、台风中心纬度、气象站台经度和气象站台纬度计算台风中心与气象站台之间的距离,公式如下:
4.根据权利
5.根据权利要求1所述的一种基于集成学习的对台风灾害预报方法,其特征在于,所述步骤(2)中,对模型进行训练具体如下:首先,将历史训练数据集导入台风风雨预报模型后,调整模型参数确定模型最佳性能参数;其次,是利用网格搜索与十倍交叉验证方法结合确定模型最优参数;网格搜索法将遍历预先设定的参数组合,评估参数采用以下公式计算得到:
6.一种基于集成学习的对台风灾害预报系统,其特征在于,包括:
7.根据权利要求6所述的一种基于集成学习的对台风灾害预报系统,其特征在于,所述数据获取模块中,台风参数数据包括:台风中心经度、台风中心纬度、气象站台经度、气象站台纬度、气象站台海拔、台风最低气压、台风近中心最大风速;再分析资料包括:西太平洋北纬 10°以北,东经 90°至 180°以内;500 hPa高度场的位势高度和纬向风;地面观测数据包括:降水量、风速;根据上述数据的二次计算或直接采用为台风风雨预报模型所配置的参数包括:台风中心经度、台风中心纬度、气象站台经度、气象站台纬度、台风中心与气象站台之间的距离、气象站台海拔、台风最低气压、台风近中心最大风速、西太副高强度、西太副高面积、西太副高西伸脊点与西太副高脊线;台风风雨预报模型预报目标参数包括:降水量、风速。
8.根据权利要求6所述的一种基于集成学习的对台风灾害预报系统,其特征在于,所述数据获取模块中,预处理包括:根据台风中心经度、台风中心纬度、气象站台经度和气象站台纬度计算台风中心与气象站台之间的距离:
9.根据权利要求6所述的一种基于集成学习的对台风灾害预报系统,其特征在于,所述台风风雨预报模块中,建立台风风雨预报模型包括:SVM模块、LSTM模块和XGBoost模块;具体如下:首先,使用SVM进行训练,以判断受台风影响的区域;通过构建分离超平面,识别时序数据中不同区域的受影响与否情况;将SVM判断的受影响区域的时序数据输入到LSTM中,以高训练轮数来捕获时序数据中的长期依赖关系;然后利用 XGBoost通过集成多个决策树,建立复杂的非线性关系;最后,以线性回归为元模型将LSTM、XGBoost的输出进行堆叠输出。
10.根据权利要求6所述的一种基于集成学习的对台风灾害预报系统,其特征在于,所述台风风雨预报模块中,对模型进行训练具体如下:首先,将历史训练数据集导入台风风雨预报模型后,调整模型参数确定模型最佳性能参数;其次,是利用网格搜索与十倍交叉验证方法结合确定模型最优参数;网格搜索法将遍历预先设定的参数组合,评估参数采用以下公式计算得到:
...【技术特征摘要】
1.一种基于集成学习的对台风灾害预报方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于集成学习的对台风灾害预报方法,其特征在于,所述步骤(1)中,台风参数数据包括:台风中心经度、台风中心纬度、气象站台经度、气象站台纬度、气象站台海拔、台风最低气压、台风近中心最大风速;再分析资料包括:西太平洋北纬10°以北,东经 90°至 180°以内;500 hpa高度场的位势高度和纬向风;地面观测数据包括:降水量、风速;根据上述数据的二次计算或直接采用为台风风雨预报模型所配置的参数包括:台风中心经度、台风中心纬度、气象站台经度、气象站台纬度、台风中心与气象站台之间的距离、气象站台海拔、台风最低气压、台风近中心最大风速、西太副高强度、西太副高面积、西太副高西伸脊点与西太副高脊线;台风风雨预报模型预报目标参数包括:降水量、风速。
3.根据权利要求1所述的一种基于集成学习的对台风灾害预报方法,其特征在于,所述步骤(1)中,预处理包括:根据台风中心经度、台风中心纬度、气象站台经度和气象站台纬度计算台风中心与气象站台之间的距离,公式如下:
4.根据权利要求1所述的一种基于集成学习的对台风灾害预报方法,其特征在于,所述步骤(2)中,建立台风风雨预报模型包括:svm模块、lstm模块和xgboost模块;具体如下:首先,使用svm进行训练,以判断受台风影响的区域;通过构建分离超平面,识别时序数据中不同区域的受影响与否情况;将svm判断的受影响区域的时序数据输入到lstm中,以高训练轮数来捕获时序数据中的长期依赖关系;然后利用 xgboost通过集成多个决策树,建立复杂的非线性关系;最后,以线性回归为元模型将lstm、xgboost的输出进行堆叠输出。
5.根据权利要求1所述的一种基于集成学习的对台风灾害预报方法,其特征在于,所述步骤(2)中,对模型进行训练具体如下:首先,将历史训练数据集导入台风风雨预报模型后,调整模型参数确定模型最佳性能参数;其次,是利用网格搜索与十倍交叉验证方法结合确定模型最优参数;网格搜索法将遍历预先设定的参数组合,评估参数采用以下公式计算得到:
...【专利技术属性】
技术研发人员:方舟,王路瑶,陈泽昌,何佳信,王伟,杨元建,张文杰,
申请(专利权)人:南京信息工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。