当前位置: 首页 > 专利查询>武汉大学专利>正文

基于随机森林的积雪时空分析与预测方法技术

技术编号:34770292 阅读:14 留言:0更新日期:2022-08-31 19:30
本发明专利技术提供一种基于随机森林的积雪时空分析与预测方法,根据地理单元之间的空间关系构建空间权重矩阵,将中心化的空间权重矩阵进行特征分解筛选特征向量,与环境变量、亮温数据、积雪密度一起作为自变量,利用随机森林方法进行建模;将建模得到的最优参数代入全体样本中得到随机森林回归模型并分析积雪变化的影响因素;最后将最优参数代入到新的自变量中,得到积雪的预测值。本发明专利技术同时考虑了环境因素和空间效应对积雪变化的影响,并将这些影响因素加入到积雪估算模型中,使得构建的积雪估算模型更加准确。估算模型更加准确。估算模型更加准确。

【技术实现步骤摘要】
基于随机森林的积雪时空分析与预测方法


[0001]本专利技术属于地学建模分析与应用的
,具体涉及一种基于随机森林的积雪时空分析与预测方法。

技术介绍

[0002]积雪是全球气候系统的重要组成部分,也是淡水的重要来源,有着显著的季节和年际变化特征,是能够反映全球气候变化的重要指标。积雪数据资料传统的获取手段是地面站点实时观测和积雪野外调查,站点实施观测的指标主要有雪深、积雪密度、雪水当量等,优势在于准确度高、观测数据丰富,不足在于站点分布不均匀,不能全面反映和代表整个区域的积雪特征;积雪野外调查通过设计测雪路线并在其中指定位置附近设计样方进行采样,测量得到该点附近的积雪参数,面临的主要问题是调查的时间连续性不高、空间覆盖范围有限。随着卫星遥感技术的发展,可以利用积雪的反射特性,通过积雪物理特性在不同波段的特性表现,构建了遥感与积雪参数的关联,实现了对积雪大范围连续观测,其中光学遥感利用积雪在可见光波段和近红外波段的反射率差异能够有效识别积雪范围,微波遥感利用其较强的穿透力可以有效观测雪深,并通过积雪密度进一步估算雪水当量。由于地理环境如下垫面的差异,微波辐射信号会收到干扰,同时积雪密度在不同的区域有并不相同,因此有很多学者提出了针对特定区域和地表环境的积雪密度模型和相应的雪水当量生成算法,从而提高了区域雪水当量估算的精度,生产发布了多个雪水当量数据集,如芬兰气象研究所GlobSnow3.0积雪产品、美国国家冰雪数据中心AMSR

E积雪产品、FY3

MWRI雪深雪水当量产品等;然而,积雪密度也会降雪累积和积雪消融发生变化引起积雪变质作用,同时复杂地形会影响积雪微波散射信号,参数固定的积雪密度模型和亮温

雪深模型都会影响雪水当量估算精度。
[0003]大量的研究表明,微波亮温与雪深之间是非线性函数关系,积雪密度模型也不仅是固定系数的模型所能完全解释的,有学者根据积雪物理属性对微波亮温做了修正,提出了动态反演算法,但结果表明该方法普适性受到限制。同时,神经网络、支持向量机、贝叶斯方法、随机森林等机器学习算法被应用到积雪遥感反演中,同时加入先验知识或物理模型,从而能够有效提高积雪估算的精度。利用神经网络方法估算得到的积雪产品具有较高的精度,且不需要对物理过程作为先验知识基础,能够解决复杂的问题,但是要求输入特征的相关性较小,且高度依赖于训练样本,同时无法得到对过程模型的理解。支持向量机反演得到的积雪深度结果能够在一定程度上减小积雪饱和效应,但当样本量很大时其计算量过大。贝叶斯方法能够显著提高精度,但是针对大数据量,蒙特卡洛马尔科夫链算法估计方法会导致计算开销太大。随机森林算法具有抗干扰、抗过拟合、训练速度快等优势,与神经网络算法相比计算量小且精确度高,不需要很多参数就可以得到不错的效果,且不需要对特征进行降维处理,同时在随机森林模型训练过程中能够检测到特征之间的影响并给出特征的重要性排序,在生态、环境等地学领域得到了广泛应用。
[0004]根据地理学第一定律,积雪与环境因素的空间分布都具有空间自相关性,积雪遥
感反演中都没有考虑到空间效应在反演中的影响。Griffith提出的特征向量空间滤值方法,通过地理单元构建的空间权重矩阵特征分解,将空间效应映射成特征向量,通过筛选其中显著的特征向量集,将影响地理变量分布的空间效应过滤出来,能够该表地理变量的空间分布模式和地理单元的空间影响,将其作为自变量加入到模型中,考虑了空间自相关性在统计建模中导致的方差膨胀效应和回归系数的偏移效应,从而降低空间效应对模型的影响、提高模型精度。该方法的优势在于利用空间权重矩阵的特征向量来表达空间影响,具有很强的可扩展性,能够直接应用于线性回归和广义线性回归,并在空气污染、植被覆盖、滑坡灾害等领域开展了应用,结果显示,特征向量空间滤值方法能够显著提高了模型的精度。
[0005]综上所述,基于机器学习的在积雪遥感估算和预测中,没有考虑积雪与环境因素空间效应的影响,也缺乏积雪变化过程的时空分析,因此,亟待提供一种估计空间效应机器学习方法实现对积雪降尺度制图和短期积雪预测,为积雪变化和全球气候变化提供重要支撑。

技术实现思路

[0006]本专利技术的目的在于针对现有技术的不足之处,提供一种基于随机森林的积雪时空分析与预测方法,本专利技术同时考虑了积雪与环境因素空间效应的影响,并对积雪变化过程进行了时空分析,使得构建的积雪估算模型更加准确,从而提高降尺度积雪制图及短期积雪预测的精度。
[0007]为解决上述技术问题,本专利技术采用如下技术方案:
[0008]一种基于随机森林的积雪时空分析与预测方法,包括以下步骤:
[0009]步骤1:获取与积雪相关的数据并对数据进行预处理;获取的数据包括积雪地面观测数据、被动微波遥感传感器亮温数据、积雪密度分布、与积雪相关的环境数据;
[0010]步骤2:对步骤1获得的数据根据地理单元之间的空间邻接或空间距离关系构建空间权重矩阵;
[0011]步骤3:将步骤2中得到的空间权重矩阵进行中心化转换并计算其特征值和特征向量,得到的特征向量按照对应特征值大小进行排列;
[0012]步骤4:按照排序,将特征值λ
i

max
>0.25对应的特征向量筛选出来,作为特征向量初筛集;
[0013]步骤5:将步骤1中除亮温数据、积雪密度、积雪地面观测数据以外的所有变量与步骤4中初筛后的特征向量初筛集作为候选变量集,利用变量筛选方法,将其中显著的向量筛选出来,作为环境变量;
[0014]步骤6:随机森林建模;将积雪地面观测数据作为因变量,将步骤5中筛选得到的环境变量与亮温数据、积雪密度一起作为自变量,利用随机森林方法进行建模,并对参数进行率定和验证,最终通过验证集的最佳指标确定模型的最优参数;
[0015]步骤7:将步骤6中得到的最优参数代入全体样本中得到随机森林回归模型,可以得到各自变量的重要性排序,分析该区域影响积雪分布的因素;
[0016]步骤8:按照步骤7中分析结果,将步骤6得到的最优参数代入到新的自变量中,得到积雪的预测值。
[0017]进一步地,步骤1中,积雪地面观测数据主要来源为积雪地面观测站点和积雪调查
测雪路线两种方式,通常是矢量数据;被动微波遥感传感器亮温数据在不同地区可选择对应精度较高的雪深反演算法及波段组合。
[0018]进一步地,步骤1中,与积雪相关的环境数据包括但不限于土地覆盖类型、高程、坡度、坡向、植被覆盖类型、叶面积指数、气温、地表温度、降水量、地表热通量、地表反照率、大气压、水蒸气含量、云层水含量、风速。
[0019]进一步地,步骤1中数据预处理的方法为:对数据进行检查,并对异常值、空值等进行处理,对于栅格数据,根据具体情况选择插值方法插补或直接剔除。
[0020]进一步地,步骤2中,空间权重矩阵分为两类:基于距离的权重矩阵和基于拓扑关系的权重矩阵,基于距离的权重矩阵针对通过积雪地本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于随机森林的积雪时空分析与预测方法,其特征在于,包括以下步骤:步骤1:获取与积雪相关的数据并对数据进行预处理;获取的数据包括积雪地面观测数据、被动微波遥感传感器亮温数据、积雪密度分布、与积雪相关的环境数据;步骤2:对步骤1预处理后的数据根据地理单元之间的空间邻接或空间距离关系构建空间权重矩阵;步骤3:将步骤2中得到的空间权重矩阵进行中心化转换并计算其特征值和特征向量,得到的特征向量按照对应特征值大小进行排列;步骤4:按照排序,将特征值λ
i

max
>0.25对应的特征向量筛选出来,作为特征向量初筛集;步骤5:将步骤1中除亮温数据、积雪密度、积雪地面观测数据以外的所有变量与步骤4中初筛后的特征向量初筛集作为候选变量集,利用变量筛选方法,将其中显著的向量筛选出来,作为环境变量;步骤6:随机森林建模;将积雪地面观测数据作为因变量,将步骤5中筛选得到的环境变量与亮温数据、积雪密度一起作为自变量,利用随机森林方法进行建模,并对参数进行率定和验证,最终通过验证集的最佳指标确定模型的最优参数;步骤7:将步骤6中得到的最优参数代入全体样本中得到随机森林回归模型,可以得到各自变量的重要性排序,分析该区域影响积雪分布的因素;步骤8:按照步骤7中分析结果,将步骤6得到的最优参数代入到新的自变量中,得到积雪的预测值。2.如权利1要求所述的基于随机森林的积雪时空分析与预测方法,其特征在于,步骤1中,积雪地面观测数据主要来源为积雪地面观测站点和积雪调查测雪路线两种方式,通常是矢量数据;被动微波遥感传感器亮温数据在不同地区可选择对应精度较高的雪深反演算法及波段组合。3.如权利1要求所述的一种基于随机森林的积雪时空分析与预测方法,其特征在于,步骤1中,与积雪相关的环境数据包括但不限于土地覆盖类型、高程、坡度、坡向、植被覆盖类型、叶面积指数、气温、地表温度、降水量、地表热通量、地表反照率、大气压、水蒸气含量、云层水含量、风速。4.如权利1要求所述的一种基于随机森林的积雪时空分析与预测方法,其特征在于,步骤1中数据预处理的方法为:对数据进行检查,并对异常值、空值等进行处理,对于栅格数据,根据具体情况选择插值方法插补或直接剔除。5.如权利1要求所述的基于随机森...

【专利技术属性】
技术研发人员:陈玉敏杨家鑫苏恒陈国栋徐真珍安钱莹
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1