一种夏季降水分级预测方法、设备及存储设备技术

技术编号:39040854 阅读:13 留言:0更新日期:2023-10-10 11:53
本发明专利技术提供了一种夏季降水分级预测方法、设备及存储设备,获取与中国夏季降水有统计意义的预测因子的再分析资料和中国地区降水观测数据;对获取的数据进行预处理,由前期的多个预测因子组成输入数据,以中国东地区夏季降水的类别为目标值;根据输入数据和目标值制作样本,将所有样本分为训练集、验证集和测试集;使用训练集和验证集对建立的AttentionU

【技术实现步骤摘要】
一种夏季降水分级预测方法、设备及存储设备


[0001]本专利技术涉及降水分级预测领域,尤其涉及一种夏季降水分级预测方法、设备及存储设备。

技术介绍

[0002]目前季节降水预报的方法主要依赖于数值模式。动力数值模式是基于物理经验方程,对天气过程进行建模。其模式误差主要来源于模式物理参数化方案,是由于人类专业知识对降水的物理过程理解的局限性。这导致了数值模式在季节预测技巧的偏低。常见的误差订正手段,是统计学作为后处理方法对数值模式的预测值进行订正。但是降水的高度复杂的非线性特征,仅靠动力预测和现有误差订正无法满足季节降水预测的需求。随着人工智能技术逐渐成熟,近几年提出了许多深度学习季节预测模型。但这些模型存在噪音干扰和过拟合两个问题亟需解决。
[0003]现有的回归模型无法避免极端降水的影响。极端降水的数量小而强度大,它自身的准确率小,并且会误导模型的优化。此外,过拟合是由于模型相对于数据特征过于复杂造成的后果,过拟合可以从模型和数据两个方面解决。模型方面的措施有增加dropout层。数据方面可以使用更高质量和更多数量的数值模式数据预训练模型,再进行迁移学习。不过dropout层的实施较为复杂,如果丢弃较多的神经元,则会导致特征无法完全学习,甚至模型无法收敛;但是如果神经元保留过多,则无法达到减小模型复杂度的效果。迁移学习可以较有效地避免过拟合的问题,但是动力数值模式预测分布和观测数据不一样。这样会导致预测的结果会有一定的偏差。

技术实现思路

[0004]针对上述问题,本专利技术提供了一种基于注意力机制和U

Net的夏季降水分级预测方法、设备及存储设备,不仅使用深度学习网络预测夏季降水分类,避免极端降水对模型的影响。并且,还使用了主成分分析(PC中国东部夏季降水分级预测)、减少模型参数和早停技术完全解决了模型过拟合问题。在提高预测准确率的同时,还改进了深度学习预测预测季节降水的一些技术性方法。针对中国东部夏季的气候,提出了一种夏季降水分级预测方法,主要包括:
[0005]S1:获取与中国夏季降水有统计意义的预测因子的再分析资料和中国地区降水观测数据;
[0006]S2:对获取的数据进行预处理,由前期的多个预测因子组成输入数据,以中国东地区夏季降水的类别为目标值;
[0007]S3:根据所述输入数据和目标值制作样本,将所有样本分为训练集、验证集和测试集三部分;
[0008]S4:建立Attention U

Net模型;
[0009]S5:使用训练集和验证集对Attention U

Net模型进行预训练;
[0010]S6:使用早停技术,重复步骤S5过程,选择更优的预训练模型;
[0011]S7:使用预训练好的Attention U

Net模型对测试集数据进行预测,当达到设定的精度后,得到最终的Attention U

Net模型,用于对实际降水分级进行预测。
[0012]进一步地,步骤S1中所述再分析资料包括:中国地区0

1米深土壤湿度和2米高气温;北半球500/850/1000hPa位势高度;南、北极圈250/500/850/1000hPa位势高度;北太平洋、北印度洋海表面温度和5米深海表面盐度;北大西洋的海表面温度;青藏高原积雪的雪深、雪温和雪反照率。
[0013]进一步地,步骤S2中所述预处理的具体过程为:
[0014]S2.1:将降水观测值按照公式(1)处理为降水距平百分率:
[0015][0016]其中,m表示气候态,pre表示降水量,单位是毫米/天,pp是降水距平百分率,单位是%;
[0017]S2.2:以中国东地区夏季降水的类别为目标值:将中国东部地区的降水距平百分率按照数值大小分为8类,这8类降水范围依次是:第1类:缺测值;第2类:

100~

45;第3类:

45~

30;第4类:

30~

15;第5类:

15~0;第6类:0~18;第7类:18~45;第8类:>45;以这些降水分类作为模型目标值,用于消除数量少和强度大的极端值噪音对模型优化的影响;
[0018]S2.3:输入数据由前期的多个预测因子组成:输入数据具体包括:提前1

3个月的观测降水量、气温和土壤湿度;春季的南、北极圈的位势高度;前冬和春季的北半球位势高度、海表面温度、海表面盐度、积雪深度、积雪温度和积雪反照率;这些变量被裁减成和观测降水数据一样的尺寸,然后按照Z

Score对各个变量分别进行归一化,Z

Score的函数定义如下:
[0019][0020]其中,x和分别表示原始数据和原始数据的平均值,s是标准差;
[0021]S2.4:将多个输入数据按照通道维度进行叠加。
[0022]进一步地,步骤S4中所述Attention U

Net模型的建立过程为:
[0023]S4.1:对输入数据A进行主成分分析,最后取得前两个主成分作为Attention U

Net模型的输入数据A1;
[0024]S4.2:采用编码器对输入数据A1进行编码后得到A5;
[0025]S4.3:采用解码器对A5进行解码后得到模型输出B。
[0026]进一步地,所述编码器的操作包括:
[0027]S4.2.1:经过DoubleConv层对输入数据A1进行处理,得到A2,所述DoubleConv层包含:两次3*3卷积、用于归一化的BatchNorm和Relu激活函数,BatchNorm的定义如下:
[0028][0029]其中,y是归一化后的数据,x为原始数据,E[x]和Var[x]分别是当前迭代计算得到的均值和方差,γ、β分别是权重和偏差,在每次反向传播后进行更新;
[0030]Relu激活函数的定义如下:
[0031]f(x)=max(0,x)
ꢀꢀ
(4)
[0032]其中,f(x)是激活函数的输出,x是激活函数的输入;
[0033]S4.2.2:对A2进行下采样处理后得到A3,所述下采样包含:最大池化层和DoubleConv层,下述下采样包含相同操作;
[0034]S4.2.3:对A3进行下采样处理后得到A4;
[0035]S4.2.4:对A4进行下采样处理后得到A5。
[0036]进一步地,所述解码器的操作包括:
[0037]S4.3.1:对A5进行上采样一处理后得到B1,该上采样一为反卷积层;
[0038]S4.3.2:对B1和A4进行AG处理后得到C1,所述AG包含:Attention Gage,Attention Gage的运算定义为:
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种夏季降水分级预测方法,其特征在于:包括:S1:获取与中国夏季降水有统计意义的预测因子的再分析资料和中国地区降水观测数据;S2:对获取的数据进行预处理,由前期的多个预测因子组成输入数据,以中国东地区夏季降水的类别为目标值;S3:根据所述输入数据和目标值制作样本,将所有样本分为训练集、验证集和测试集三部分;S4:建立Attention U

Net模型;S5:使用训练集和验证集对Attention U

Net模型进行预训练;S6:使用早停技术,重复步骤S5过程,选择更优的预训练模型;S7:使用测试集样本和S6中得到的最优的Attention U

Net模型,用于对实际降水分级进行预测。2.如权利要求1所述的一种夏季降水分级预测方法,其特征在于:步骤S1中所述再分析资料包括:中国地区0

1米深土壤湿度和2米高气温;北半球500/850/1000hPa位势高度;南、北极圈250/500/850/1000hPa位势高度;北太平洋、北印度洋海表面温度和5米深海表面盐度;北大西洋的海表面温度;青藏高原积雪的雪深、雪温和雪反照率。3.如权利要求1所述的一种中国东部夏季降水分级预测方法,其特征在于:步骤S2中所述预处理的具体过程为:S2.1:将降水观测值按照公式(1)处理为降水距平百分率:其中,m表示气候态,pre表示降水量,单位是毫米/天,pp是降水距平百分率,单位是%;S2.2:以中国东地区夏季降水的类别为目标值:将中国东部地区的降水距平百分率按照数值大小分为8类,这8类降水范围依次是:第1类:缺测值;第2类:

100~

45;第3类:

45~

30;第4类:

30~

15;第5类:

15~0;第6类:0~18;第7类:18~45;第8类:>45;以这些降水分类作为模型目标值,用于消除数量少和强度大的极端值噪音对模型优化的影响;S2.3:输入数据由前期的多个预测因子组成:输入数据具体包括:提前1

3个月的观测降水量、气温和土壤湿度;春季的南、北极圈的位势高度;前冬和春季的北半球位势高度、海表面温度、海表面盐度、积雪深度、积雪温度和积雪反照率;这些变量被裁减成和观测降水数据一样的尺寸,然后按照Z

Score对各个变量分别进行归一化,Z

Score的函数定义如下:其中,x和分别表示原始数据和原始数据的平均值,s是标准差;S2.4:将多个输入数据按照通道维度进行叠加。4.如权利要求1所述的一种夏季降水分级预测方法,其特征在于:步骤S4中所述Attention U

Net模型的建立过程为:S4.1:对输入数据A进行主成分分析,最后取得前两个主成分作为Attention U

Net模型的输入数据A1;
S4.2:采用编码器对输入数据A1进行编码后得到A5;S4.3:采用解码器对A5进行解码后得到模型输出B。5.如权利要求4所述的一种夏季降水分级预测方法,其特征在于:所述编码器的操作包括:S4.2.1:经过DoubleConv层对输...

【专利技术属性】
技术研发人员:陆佩榕邓琪敏
申请(专利权)人:中国地质大学武汉
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1