System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于随机森林与气象数据的云预测方法技术_技高网
当前位置: 首页 > 专利查询>南京大学专利>正文

一种基于随机森林与气象数据的云预测方法技术

技术编号:40924540 阅读:4 留言:0更新日期:2024-04-18 14:48
本发明专利技术提供了一种基于随机森林与气象数据的云预测方法,该方法以气象数据为数据集进行模型训练,在多维的数据集选取方案与模型优化方法的作用下,可以实现高精度与高准确率的有云、无云预测。气象数据集包括地表、高空数据在内的多个水平面内数据,可以避免云层影响因素的遗漏;由于随机森林在处理数据噪声、进行分类任务方面的优越表现,模型训练成本较低,所需时间短;系统的预测结果通过多参数进行评估,有助于系统的多场景、高效率利用。

【技术实现步骤摘要】

本专利技术属于星地激光通信,具体涉及一种应用于星地激光链路可靠通信系统的基于随机森林与气象数据的云预测模型方法。


技术介绍

1、随着信息化社会发展,以及空间数据需求量的增加,激光通信凭借通信速率高、传输容量大以及设备成本低的优势,成为未来空间网络发展的趋势,可有效缓解空间网络中的传输压力。然而,相较于星间激光通信,在星地激光通信过程中由于大气衰减效应,尤其以云层的散射和吸收为主,往往会对星地激光链路造成较大影响,导致激光传输信号严重衰减甚至中断,成为影响星地激光组网过程中通信质量的关键因素。

2、为确保星地激光链路的可靠性连接,保证通信的持续进行,通常选用链路切换的方法,即当卫星与某个地面光学站的激光通信链路被云层遮挡时,则切换到与另一地面光学站建立的无云遮挡的链路,以此来有效降低云层干扰带来的影响。但是链路切换往往需要时间与成本,如果云层遮挡导致链路切断后再进行切换,还会导致数据传输中断。因此通过对星地激光通信链路上的有云、无云情况进行有效的预测,可对链路进行提前切换,进而避免中断出现后临时切换带来的传输中断或数据丢失。

3、目前,传统的气象数值预报与近年兴起的基于神经网络模型的云层预测方法,都可以对云覆盖率进行预测。然而,传统气象数值预报的方法存在对大气运动规律认识和表达的不足,物理参数模式化也有所欠缺,预测结果存在较大程度的误差,准确率通常只有50%左右;而神经网络的方法虽然具有更高准确率,但缺少数学物理机理约束,因此在迭代的过程中会不断积累迭代误差,并且由于计算复杂度高、参数量大,往往训练成本很高

4、南京大学公开了一种基于深度学习的云层变化趋势预测方法(申请号:202010436563.0),其是针对星地激光通信过程中的云团预测问题,该方法在对云团的变化趋势预测方面,存在以下的不足: ①使用神经网络进行云变化趋势预测,数据集为图像形式数据,训练模型通常需要花费几个小时以上;②侧重于云图变化趋势的预测,虽然在有云无云方面也可以达到90%以上的准确率,但预测提前量仅为分钟级。


技术实现思路

1、专利技术目的:为了克服现有技术中存在的不足,本专利技术提供一种基于随机森林与气象数据的云预测方法,用以在星地激光通信过程中,提高对有云无云预测的准确率,并解决云预测模型训练花费时间长、可提前预测的时间短的问题。

2、技术方案:为确保星地激光通信链路的可靠传输,尽可能避免云层干扰导致的传输中断的技术问题,本专利技术采用以下技术方案:一种基于随机森林与气象数据的云预测方法,包括以下步骤:

3、步骤s1,数据筛选:建立随机森林模型,以数值预报系统作为气象因子数据库,并根据气象学中各气象因子对预覆盖率的影响大小,对气象因子进行筛选,并作为本预测方法的输入数据;

4、步骤s2,模型训练:将步骤s1筛选得到的数据按训练集:测试集:验证集=7:2:1的比例进行划分,并通过训练集的数据对随机森林模型进行训练,得到训练优化后的模型;

5、步骤s3,结果评估:该步骤通过将有云无云的预测结果,与实际的有云无云进行对比,有云即为1,无云即为0;通过召回得分、精确度、f1调和平均值、偏差四个参数进行评估,所述四个参数由下面公式给出:

6、,

7、所述分别依次对应实际有云预测有云、实际有云预测无云、实际无云预测有云、实际无云预测无云四种结果。

8、进一步的,步骤s2所述模型训练的过程依次包括基线拟合、主成分分析和超参数优化三个步骤,具体过程如下:

9、(1)基线拟合:通过权重计算函数,计算得到不同气象因子的的基尼指数并进行排序;所述基尼指数反映不同气象因子对云覆盖率的影响大小,基尼指数大的气象因子,在后续的预测过程中,将相应地被赋予更高的权重;

10、(2)主成分分析:在上述基线拟合的基础上,通过下式确定在保证拟合效果达到预设阈值的前提下,所需的最少气象因子数量n,

11、 ,

12、式中,为气象因子总量,为表示第i个气象因子,且按照基线拟合中结果从到排序,为累计方差比函数,函数值越大,则拟合效果越好;

13、(3)超参数优化:

14、首先,在主成分分析确定影响气象因子后,对随机森林模型的超参数进行优化调整设置;所述超参数包括“决策树的数量”、“决策树的最大深度”、“拆分的最大特征数”、“拆分内部节点所需的最小样本数”、“叶子节点包含的最少样本数量”、“是否随机放回抽样”,分别用n_estimators,max_depth,max_feature,min_samples_split,min_samples_leaf,bootstrap表示;

15、然后,采用随机搜索的方法,从预先设置的超参数采样数值中随机选取不同的组合,在达到预先设定的采样次数后,比较不同组合所构成模型的预测结果并进行排名,得到局部最优的超参数组合;

16、最后,通过网络搜索的方法,在得分高的超参数组合中,选取步长更小的超参数数值;并以此遍历所有的超参数组合,再进行预测结果排名,确定预测准确率最高的模型。

17、进一步的,所述超参数优化步骤中所述随机搜索的方法是基于randomsearchcv函数;所述网络搜索的方法基于gridsearchcv函数。

18、进一步的,步骤s1中所述气象因子的筛选是在选定的经纬度网格范围内,以气压高低为划分标准,从六个高度平面进行选取,分别为第1层的地表气象因子和第2-6层的高空气象因子;

19、所述所述地表气象包括温度、湿度、气压、u分量风和v分量风;所述高空气象包括可降水量、露点温度、露点下降、相对湿度、反演云顶高度。

20、进一步的,所述高空气象因子的选取,在选取中心点处气象因子的同时,还分别选取相对中心点东西南北四个方向并距离4km处对应的气象因子。

21、有益效果:与现有技术相比,本专利技术中提出的云预测模型借助随机森林算法实现,由于随机森林可以并行训练多棵决策树,并且参数数量少,不像神经网络需要不断迭代,参数众多,数据维度高,因此本模型训练所需时间短,对同样的有云无云事件预测,所需的时间从几小时降低到十几分钟,有效避免了资源的浪费;而对有云无云的预测,在准确率方面也有较好的表现,因为随机森林中的基本单元决策树的构建采用随机采样的思想,使得它不易受到数据噪声的干扰,因此鲁棒性较强,模型性能较好。

本文档来自技高网...

【技术保护点】

1.一种基于随机森林与气象数据的云预测方法,其特征在于包括以下步骤:

2.根据权利要求1所述基于随机森林与气象数据的云预测方法,其特征在于:步骤S2所述模型训练的过程依次包括基线拟合、主成分分析和超参数优化三个步骤,具体过程如下:

3.根据权利要求2所述基于随机森林与气象数据的云预测方法,其特征在于:所述超参数优化步骤中所述随机搜索的方法是基于RandomSearchCV函数;所述网络搜索的方法基于GridSearchCV函数。

4.根据权利要求1所述基于随机森林与气象数据的云预测方法,其特征在于:步骤S1中所述气象因子的筛选是在选定的经纬度网格范围内,以气压高低为划分标准,从六个高度平面进行选取,分别为第1层的地表气象因子和第2-6层的高空气象因子;

5.根据权利要求4所述基于随机森林与气象数据的云预测方法,其特征在于:所述高空气象因子的选取,在选取中心点处气象因子的同时,还分别选取相对中心点东西南北四个方向并距离4km处对应的气象因子。

【技术特征摘要】

1.一种基于随机森林与气象数据的云预测方法,其特征在于包括以下步骤:

2.根据权利要求1所述基于随机森林与气象数据的云预测方法,其特征在于:步骤s2所述模型训练的过程依次包括基线拟合、主成分分析和超参数优化三个步骤,具体过程如下:

3.根据权利要求2所述基于随机森林与气象数据的云预测方法,其特征在于:所述超参数优化步骤中所述随机搜索的方法是基于randomsearchcv函数;所述网络搜索的方法基于gridsearchcv...

【专利技术属性】
技术研发人员:李文峰胡马援周彦峤赵康僆方元
申请(专利权)人:南京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1