当前位置: 首页 > 专利查询>福州大学专利>正文

一种基于随机森林的土壤侵蚀影响因子重要性分析方法技术

技术编号:19822764 阅读:105 留言:0更新日期:2018-12-19 15:03
本发明专利技术涉及一种基于随机森林的土壤侵蚀影响因子重要性分析方法,首先获取研究区水土流失等级情况及相应的属性,接着对得到的数据按照不同的流失等级分别随机抽取等量的样本;然后以抽取的样本点作为分析的数据集,通过遍历比较的方法确定随机森林模型中两个分别表示构建决策树分支时随机抽样的节点数mtry和决策树数量ntree的参数最优解;接着以确定的最优参数解为基础,构建最优随机森林模型,利用袋外数据计算两个度量变量因子重要性的指标;最后综合考虑平均精确率减少值MDA和平均不纯度减少值MDG进行重新排序,确定各变量因子的重要性。本发明专利技术解决了土壤侵蚀影响因子缺乏重要性界定标准的问题。

【技术实现步骤摘要】
一种基于随机森林的土壤侵蚀影响因子重要性分析方法
本专利技术涉及水土流失研究领域,特别是一种基于随机森林的土壤侵蚀影响因子重要性分析方法。
技术介绍
水土流失是生态恶化的集中体现,不仅导致土地退化,而且加剧了洪涝灾害等问题。水土流失的发生是诸如地形地貌、自然气候及人类活动等多重因素共同作用的结果。现有的技术大多停留在单因素对水土流失影响方面的研究,开展影响水土流失的综合因素的研究较少。目前对土壤侵蚀影响因子的重要分析是通过t检验和偏相关系数,该方法存在角度较为单一、要求样本含量少和对特征独立性要求高等缺点。随机森林是一种利用自助法重抽样方法从原始样本中抽取多个样本,组合很多个相对独立的决策树,建立决策树“森林”,进行“投票”决定最终预测结果的统计学习方法。它主要是通过影响因子改变导致的袋外误差的增加等方法进行重要性评估。相较于现行的方法,具有角度多样、可容许样本量大、对多元共线性不敏感、对异常值和噪声具有很好的容忍度、精度较高等优点。随机森林算法在火灾、滑坡及入侵物种等方面的影响因素分析中得到应用,本专利技术将其应用于土壤侵蚀影响因子重要性的研究中。
技术实现思路
鉴于此,本专利技术的本文档来自技高网...

【技术保护点】
1.一种基于随机森林的土壤侵蚀影响因子重要性分析方法,其特征在于:包括以下步骤:步骤S1:获取研究区水土流失等级情况及相应的属性,所述属性包括坡度、坡长、植被覆盖度、土地利用类型、年侵蚀性降雨量及土壤类型数据;步骤S2:对步骤S1所得到的数据按照不同的流失等级分别随机抽取等量的样本,每一样本点包括水土流失等级状况、坡度、坡长、土地利用类型、植被覆盖度、年侵蚀性降雨量及土壤类型;步骤S3:以步骤S2抽取的样本点作为分析的数据集,通过遍历比较的方法确定随机森林模型中两个分别表示构建决策树分支时随机抽样的节点数mtry和决策树数量ntree的参数最优解;步骤S4:以步骤S3确定的最优参数解为基础,构...

【技术特征摘要】
1.一种基于随机森林的土壤侵蚀影响因子重要性分析方法,其特征在于:包括以下步骤:步骤S1:获取研究区水土流失等级情况及相应的属性,所述属性包括坡度、坡长、植被覆盖度、土地利用类型、年侵蚀性降雨量及土壤类型数据;步骤S2:对步骤S1所得到的数据按照不同的流失等级分别随机抽取等量的样本,每一样本点包括水土流失等级状况、坡度、坡长、土地利用类型、植被覆盖度、年侵蚀性降雨量及土壤类型;步骤S3:以步骤S2抽取的样本点作为分析的数据集,通过遍历比较的方法确定随机森林模型中两个分别表示构建决策树分支时随机抽样的节点数mtry和决策树数量ntree的参数最优解;步骤S4:以步骤S3确定的最优参数解为基础,构建最优随机森林模型,利用袋外数据计算两个度量变量因子重要性的指标;所述两个度量变量因子重要性的指标为平均精确率减少值MDA和平均不纯度减少值MDG;步骤S5:综合考虑平均精确率减少值MDA和平均不纯度减少值MDG进行重新排序,确定各变量因子的重要性。2.根据权利要求1所述的一种基于随机森林的土壤侵蚀影响因子重要性分析方法,其特征在于:步骤S1具体包括以下步骤:步骤S11:收集研究区所需的数字高程模型DEM、土壤类型数据及所选年份的中等分辨率遥感影像、降雨量数据;步骤S12:以数字高程模型DEM为基础,计算坡度、坡长值;步骤S13:以中等分辨率遥感影像为基础,进行土地利用类型分类,同时计算植被覆盖度;步骤S14:以逐小时的降雨量数据为基准,以一次降雨事件为单位,设定阈值剔除非侵蚀性降雨,将侵蚀性降雨进行累加,获得年侵蚀性降雨量。3.根据权利要求2所述的一种基于随机森林的土壤侵蚀影响因子重要性分析方法,其特征在于:步骤S12中,所述坡度以最大坡降算法计算,利用中心格网点与周围八个格网点的高程差计算坡度,公式如下:式中,g为格网间距,zi为3*3移动窗口中第i个格网单元的高程,其中i=1,2,3,...,8;当单元i相对于中心单元处于对角线时,反之k=1;β表示坡度,z0表示中心单元的高程;所述坡长采用非流量累积的方法计算。4.根据权利要求3所述的一种基于随机森林的土壤侵蚀影响因子重要性分析方法,其特征在于:所述坡长采用非流量累积的方法计算具体包括以下步骤:步骤S121:通过最大坡降算法计算格网单元的流向;步骤S122:进行局部高地标识:局部高地是指存在DEM中的山顶、山脊线上的点以及位于DEM边缘的点,这些点的特征是只有水流流出而没有水的流入,它能够通过水流方向矩阵进行识别,即给定格网单元周边各相邻点的水流方向均不指向该单元;步骤S123:计算格网单元的非累计坡长,当每一个格网单元的流向和DEM中的高地标识完成后,计算该格网单元的非累计坡长,其规则为:当格网单元为所标识的局部高地点时,该格网的非累积坡长为格网分辨率的1/2乘以1或当格网单元为非局部高地点,则该格网的非累计坡长等于格网分辨率,或等于格网分辨率的倍;步骤S124:格网单元的累积坡长计算:按照...

【专利技术属性】
技术研发人员:汪小钦陈妙金陈芸芝吴思颖
申请(专利权)人:福州大学
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1