一种基于随机森林的西北内陆河生态基流预测方法技术

技术编号:24997624 阅读:57 留言:0更新日期:2020-07-24 17:59
本发明专利技术涉及水文生态领域,具体为一种基于随机森林的西北内陆河生态基流预测方法包括如下步骤:S1.收集河流近10年逐月数据;S2.形成原始样本P;S3.生成训练样本集和测试样本集;S4.形成N个训练子集Sn;S5.构建决策树;S6.在决策树结点处,从现结点生成两个子结点;S7.生成完全决策树Tn;S8.对完全决策树Tn进行剪枝;S9.选择出最佳决策树;S10.构建多颗决策树构建;S11.所有决策树进行组合;本发明专利技术基于西北内陆河特点,综合考虑河道生态系统多方面因素,满足河道生态系统的多纬度需求,建立西北内陆河生态基流预测方法,节约计算时间,提供工作效率,满足河道生态系统多样性需求,为水利、生态主管部门制定相关决策提供数据支撑。

【技术实现步骤摘要】
一种基于随机森林的西北内陆河生态基流预测方法
本专利技术涉及水文生态领域,具体为一种基于随机森林的西北内陆河生态基流预测方法。
技术介绍
河流生态基流量是指为保证河流生态服务功能,用以维持或恢复河流生态系统基本结构与功能所需的最小流量。研究和确定河流生态基流量的目的在于遏止河道断流或流量减少而造成的生态环境恶化,最终实现流域河流生态系统的可持续发展。我国西北内陆河主要分布在35°N以北,106°E以西的内陆干旱区,包括新疆全境、甘肃河西走廊及内蒙古贺兰山以西的地区,土地面积约占中国总土地面积的24.5%。深居欧亚大陆腹地,平均降水量在150mm以下,形成世界上最严酷的干旱区之一。由于日照时间长以及太阳辐射较强,因此气温通常较高,水分容易蒸发和蒸腾;加之植被稀少,地貌通常以沙漠、沙地、戈壁和荒漠为主,加剧了水分的蒸发蒸腾作用,大部分地区蒸发量为1000~2000mm。流域径流量主要集中在夏季,夏季水量占全年径流量50---70%,由于高山冰川或者融雪水的补给,所以径流年际变化较小,夏季一般能满足生态基流的需要。随季节水文变化,普遍存在水质本文档来自技高网...

【技术保护点】
1.一种基于随机森林的西北内陆河生态基流预测方法,其特征在于:包括如下步骤:/nS1. 收集河流近10年逐月数据,包括月平均流量Q、多年平均含沙量S、月平均含沙量C、河流稀释系数λ、月河段排污总量Qi、设定保证率(Po=90%)下的月河道流量Qni、月水面蒸发深度Ho、月水体平均蓄水面积A、月时段内降雨量R;/nS2.将步骤S1数据形成原始样本P;/nS3.将步骤S2的原始样本P进行随机抽样生成训练样本集和测试样本集,训练样本集和测试样本集的比例为7:3;/nS4.对步骤S3形成的训练样本集进行随机有放回无权重抽样,形成N个训练子集Sn;/nS5.选取步骤S4中的一个训练子集Sn,Sn中存在D...

【技术特征摘要】
1.一种基于随机森林的西北内陆河生态基流预测方法,其特征在于:包括如下步骤:
S1.收集河流近10年逐月数据,包括月平均流量Q、多年平均含沙量S、月平均含沙量C、河流稀释系数λ、月河段排污总量Qi、设定保证率(Po=90%)下的月河道流量Qni、月水面蒸发深度Ho、月水体平均蓄水面积A、月时段内降雨量R;
S2.将步骤S1数据形成原始样本P;
S3.将步骤S2的原始样本P进行随机抽样生成训练样本集和测试样本集,训练样本集和测试样本集的比例为7:3;
S4.对步骤S3形成的训练样本集进行随机有放回无权重抽样,形成N个训练子集Sn;
S5.选取步骤S4中的一个训练子集Sn,Sn中存在D个特征变量,随机抽取K个特征变量,K<D,从根节点开始构建决策树;
S6.在决策树结点处,对其任意特征Ki,与其对应的取值Yi,根据样本点对Ki=Yi的测试为“是”或“否”将Sn分割成Sn1和Sn2两部分,计算Xi=Yi时的Gini系数,计算公式为:



公式中:K为样本个数;P(k)表示样本点属于第k类的概率;
对所有特征Ki以及与其对应的取值Yi进行计算,并根据步骤S6进行Gini系数计算,基于Gini系数最小的特征为最优特征,依最优特征,从现结点生成两个子结点,将训练子集Sn依特征分配到两个子结点中去;
S7.对步骤S6生成的两个子结点递归地调用步骤S6计算Gini系数,直至满足Gini系数最小特征,无法继续分裂下去,生成完全决策树Tn;
S8.对步骤S7生成的完全决策树Tn进行剪枝:对完全决策树Tn的每个非叶结点计算α值,循环剪掉具有最...

【专利技术属性】
技术研发人员:王志鹏魏帮财桑占宏魏荣苏锐
申请(专利权)人:中电万维信息技术有限责任公司
类型:发明
国别省市:甘肃;62

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1