当前位置: 首页 > 专利查询>复旦大学专利>正文

一种基于机器学习的随机云生成器加速方法技术

技术编号:37985747 阅读:9 留言:0更新日期:2023-06-30 10:00
本发明专利技术属于云的物理参数化技术领域,具体为一种基于机器学习的随机云生成器加速方法。本发明专利技术采用机器学习方法来对随机云生成器进行替代,获得便捷快速的机器学习模型,该模型根据输入的云量廓线以及总云量可以快速地获得对应的抗相关厚度,免去了繁琐的遍历与随机数生成过程,极大地加快了抗相关厚度的获取速度,对于生成云的次网格结构有重要意义。基于本发明专利技术计算的数据集,在分辨率、纬度与抗相关厚度之间建立参数化关系,给出了抗相关厚度随着分辨率与纬度的平均变化,该参数化方案可直接应用于数值模式中,对提高模式的模拟准确度具有着重要意义。具有着重要意义。具有着重要意义。

【技术实现步骤摘要】
一种基于机器学习的随机云生成器加速方法


[0001]本专利技术属于云的物理参数化
,具体涉及一种基于机器学习的随机云生成器加速方法。

技术介绍

[0002]云在地

气系统的辐射收支平衡中起着关键性的作用,同时占据了地球表面约60%的面积。云是气候系统中各种动力、热力过程综合作用的结果,它能够通过自身的微物理特性以及生成发展过程中参与的物理过程,从各个方面对气候系统产生影响。
[0003]大气科学中的数值模式是指利用数学模型对大气系统进行数值模拟和预测的过程。这种模型是基于物理、化学和数学原理,通过对大气系统中各种变量的计算和模拟,来预测未来天气和气候变化。数值模式通常包括大气动力学方程、热力学方程、辐射传输方程、云微物理方程等。数值气候模式作为研究全球气候变化的重要途径,对云的模拟与描述是其比较薄弱的一个环节,全球天气和气候模式的网格尺度一般在几十甚至几百千米以上,尽管云的垂直廓线可以通过模式中的诊断方法得到,而由于云层垂直重叠关系的复杂性,云的垂直重叠特征—即位于不同高度上的云层之间在垂直方向上如何重叠,尚且不能在全球气候模式的网格分辨率下准确构建,目前依旧只能给出比较粗略的云垂直重叠假设进行描述。
[0004]目前比较流行的云重叠假设包括:最大重叠假设,随机重叠假设,最大随机重叠假设以及指数衰减重叠假设,其中指数衰减重叠假设的应用最为广泛。该假设通过名为云重叠参数(α)的加权因子将云层之间的云量表示为最大重叠和随机重叠的线性组合,并将α进一步拟合为抗相关厚度L和层间距离D的函数:这个假设有效避免了对气候模式垂直分辨率的依赖,并且充分体现了云层重叠特征的多样性,相比其他重叠假设有明显优势。
[0005]为了将该灵活的指数衰减重叠假设应用在气候模式中,一般需要采用随机云生成器对云的垂直结构进行生成。而这个生成过程需要我们提供云层之间的抗相关厚度L,但是随机云生成器在寻找合适的抗相关厚度的过程中需要经过漫长的随机数生成过程,非常耗时。

技术实现思路

[0006]本专利技术的目的在于提供一种速度快、精度高的基于机器学习的随机云生成器加速方法。
[0007]本专利技术提供的基于机器学习的随机云生成器加速方法,具体步骤为:
[0008](1)构建机器学习模型,用于生成大量抗相关厚度数据;该机器学习模型是多层感知机(Multilayer Perception

MLP)模型;
[0009](2)将根据卫星观测得到的云量廓线数据与总云量数据,输入机器学习模型,到对应的抗相关厚度;
[0010](3)将卫星观测时的分辨率与纬度信息与该抗相关厚度数据结合,得到分辨率、纬
度、抗相关厚度三元组数据集;根据该三元组数据集,在分辨率、纬度与抗相关厚度之间建立参数化关系,具体为一个五阶多项式(依据2008年5、6月数据):
[0011]F(Res,Lat)=c+a1*Res+a2*Lat+a3*Res2+a4*Res*Lat+a5*Lat2…
+a
20
*Lat5[0012]其中,Res,Lat为输入分辨率与纬度,c为常数项,a
i
,i=1,2

,20为多项式系数;
[0013](4)将该参数化关系直接应用于使用数学模型对大气系统进行数值模拟与预测的气候数值模式(该气候数值模式为现有的技术)中,数值模式直接根据模拟区域的分辨率与纬度,获得在该分辨率与纬度下的抗相关厚度的均值,使用该抗相关厚度均值可直接对该区域的云重叠情况进行模拟,可以极大地减小云不确定性给数值模式带来的影响,对数值模式中的云重叠应用有着重要意义,可以极大地提高数值模式的模拟与预测的准确性。
[0014]本专利技术构建的机器学习模型,包括输入层、隐藏层和输出层,共有八个层级:第一层为输入层,共有105个输入神经元,用于读取总云量与云量廓线信息;隐藏层共有六层神经网络,接收来自于输入层的特征向量,其中,前四层神经网络均由128个神经元组成,第五层神经网络由64个神经元组成,第六层神经网络由32个神经元组成。隐藏层中,前四层是为了引入足够的神经元,来提取足够的特征进行学习,并且增强神经网络的拟合能力,后两层则是为了逐步聚合之前提取到的特征,将特征进行聚合汇入到输出层中。最后一层为输出层,共有1个神经元,用于输出所有层最后的拟合结果,即抗相关厚度。
[0015]本专利技术中,机器学习模型的训练,采用均方误差MSE(Mean Squared Error)作为损失函数,通过计算预测值与真实值之间的均方误差,评估模型预测结果与真实值之间的差异程度,从而进一步优化模型的性能。在训练过程中,使用反向传播算法来计算梯度,并且使用梯度下降方法来优化MSE损失函数。
[0016]本专利技术使用一个批处理大小为256的训练策略来训练模型,即在一次迭代中同时计算256个样本,并将他们的梯度平均值用于更新模型参数。这种训练策略可以提高训练效率,减少内存消耗,并且通常能够在较短的时间内获得较好的收敛性能。
[0017]在完成了模型的训练之后,只需要将观测得到的云量廓线与总云量输入模型,经过模型的中间层计算,模型便可得到该云量廓线与总云量所对应的抗相关厚度,并将其输出。
[0018]本专利技术的有益效果:
[0019]与传统的随机云生成器的遍历搜索方法寻找合适的抗相关厚度相比,本专利技术的机器学习模型在经过CloudSat卫星搭载的94GHz毫米波云廓线雷达(Cloud Profiling Radar

CPR)的四个月的数据进行两千轮初步训练之后,在训练集上机器学习模型的输出与真实值之间的决定系数便可达到0.986的高值,在测试集上的输出与真实值之间的决定系数也可达到0.953的高值。并且对于四个月的约700000组数据,本专利技术的机器学习模型仅需6秒左右便可得到所有的输出;而对于传统的随机云生成器,仅输入的400组数据便需要约2000秒左右才可得到所有的结果。因此,可以看出本专利技术得到的抗相关厚度精度很高的同时,运算速度也远胜随机云生成器。
附图说明
[0020]图1为随机云生成器的次网格划分示意图。
[0021]图2为本专利技术采用的机器学习模型示意图。
[0022]图3为本专利技术在训练集上生成的抗相关厚度与随机云生成器的结果对比。
[0023]图4为本专利技术在测试集上生成的抗相关厚度与随机云生成器的结果对比。
[0024]图5为本专利技术在训练集上生成的抗相关厚度用于随机云生成器时得到的总云量与真实云量之间的关系。
[0025]图6为本专利技术在测试集上生成的抗相关厚度用于随机云生成器时得到的总云量与真实云量之间的关系。
[0026]图7为使用本专利技术生成的数据集在模式网格分辨率为4km时,在纬度与抗相关厚度之间建立的参数化关系。
[0027]图8为使用本专利技术生成的数据集在纬度为40
°
N时,在模式网格分辨率与抗相关厚度之间建立的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的随机云生成器加速方法,其特征在于,具体步骤为:(1)构建机器学习模型,用于生成大量抗相关厚度数据;该机器学习模型是多层感知机模型;(2)将根据卫星观测得到的云量廓线数据与总云量数据,输入机器学习模型,到对应的抗相关厚度;(3)将卫星观测时的分辨率与纬度信息与该抗相关厚度数据结合,得到分辨率、纬度、抗相关厚度三元组数据集;根据该三元组数据集,在分辨率、纬度与抗相关厚度之间建立参数化关系,具体为一个五阶多项式:F(Res,Lat)=c+a1*Res+a2*Lat+a3*Res2+a4*Res*Lat+a5*Lat2…
+a
20
*Lat5其中,Res,Lat为输入分辨率与纬度,c为常数项,a
i
,i=1,2

,20为多项式系数;(4)将该参数化关系直接应用于对大气系统进行数值模拟与预测的气候数值模式中,气候数值模式根据模拟区域的分辨率与纬度,获得在该分辨率与纬度下的抗相关厚度的均值,使用该抗相关厚度均值直接对该区域的云重叠...

【专利技术属性】
技术研发人员:张峰吴昕肖海霞
申请(专利权)人:复旦大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1