当前位置: 首页 > 专利查询>河海大学专利>正文

一种基于随机森林的防洪系统显效工程智能辨识方法技术方案

技术编号:24614043 阅读:30 留言:0更新日期:2020-06-24 01:25
本发明专利技术公开了一种基于随机森林的防洪系统显效工程智能辨识方法,包括:建立随机森林特征属性集;建立防洪系统“混合等效调度”模型,生成训练及验证样本集;基于“随机”思想构建随机森林基分类器;基于“集成”思想构建随机森林分类模型;建立考虑不均等代价的分类精度评价指标,评价显效工程辨识精度。本发明专利技术方法针对防洪系统历史洪水“小样本”的特点,为充分利用属性集及训练样本信息,基于随机森林“随机”和“集成”两种思想,提高了显效工程分类精度;通过引用机器学习原理,提高显效工程辨识效率;针对辨识结果不同种类错误代价不均等问题,利用期望总体代价评价随机森林分类精度。

An intelligent identification method of effective projects for flood control system based on random forest

【技术实现步骤摘要】
一种基于随机森林的防洪系统显效工程智能辨识方法
本专利技术涉及防洪系统实时调度方法,尤其是一种基于随机森林的防洪系统显效工程智能辨识方法。
技术介绍
防洪系统实时联合调度中,根据实时水雨工情信息智能辨识显效工程,并据以自组织建立“混合等效调度”模型,是降低防洪系统联合调度模型维数的有效途径,其关键是如何准确辨识显效工程集。“显效工程”是防洪调度领域全新的概念,目前对此研究较少,已有技术是基于推理规则辨识显效工程。该方法是建立辨识指标体系,通过指标阈值确定推理规则,但指标阈值的确定受洪水样本、调度模型等主客观因素影响,随着洪水资料的积累,需定期检验和调整指标阈值,致使显效工程的辨识结果具有不确定性。实际上从防洪工程全集中辨识显效工程子集,是样本聚类问题,采用机器学习方法从样本中直接发掘规则,可以有效克服基于固定阈值的规则推理的缺陷。决策树、神经网络、贝叶斯分类器等机器学习分类算法通常需要大量训练样本,但防洪显效工程辨识问题中通常样本量较少,随机森林分类算法是集成学习的代表性方法,能解决“小样本”分类问题、避免“过拟合”现象。因此,利用随机森林分类算法进行显效工程的准确高效辨识,是自组织建立“混合等效调度”模型、提高防洪效率的重要途径。在显效工程辨识过程中,不同类型的错误会造成不同程度的后果。若将非显效工程误判为显效工程,仅会增加防洪调度的复杂度;若将显效工程误判为非显效工程,则会使防洪效果降低,增大防洪风险,甚至造成下游的洪涝灾害,故此类错误代价远大于前者。如何考虑两种错误的不均等代价,选择合理的分类精度评价指标,是评价随机森林分类模型在显效工程辨识中应用效果的关键内容。
技术实现思路
专利技术目的:提供一种基于随机森林的防洪系统显效工程智能辨识方法,以解决现有技术存在的上述问题。技术方案:为实现上述专利技术目的,本专利技术采用以下技术方案:一种基于随机森林的防洪系统显效工程智能辨识方法,包括以下步骤:(1)建立随机森林特征属性集;(2)建立防洪系统“混合等效调度”模型,生成训练及验证样本集;(3)基于“随机”思想构建随机森林基分类器;(4)基于“集成”思想构建随机森林分类模型;(5)建立考虑不均等代价的分类精度评价指标,评价显效工程辨识精度。进一步的,步骤(1)中充分考虑防洪系统实时水、雨、工情信息,选取防洪工程控制流域预测来水量、被补偿区间来水量、工程防洪压力、防洪点洪量贡献值、防洪点洪峰贡献值、防洪点洪水重叠度、工程间洪水重叠度为随机森林特征属性集。进一步的,步骤(2)包括以下步骤:(21)所述防洪系统“混合等效调度”模型分为以最大削峰准则为目标的非显效工程单独优化调度和以防洪点洪峰流量最小为目标的显效工程联合优化调度;单独优化调度目标函数为:minF1=max(q(t))(1);其中,q(t)为t时刻水库出库流量;联合优化调度目标函数为:其中,M1为显效水库数目;q′(i,t)为第i库出库流量在公共防洪点响应过程;q′区(i,t)为各显效水库私有防洪点上游区间来水在公共防洪点的响应过程;q′区s(t)为公共防洪点上游区间来水在公共防洪点的响应过程;约束条件包括:1)水量平衡约束V(i,t)=V(i,t-1)+(Q(i,t)-q(i,t))·Δt(3);其中,V(i,t-1)、V(i,t)分别为第i水库t-1时刻和t时刻的蓄水量;Q(i,t)和q(i,t)分别为第i水库t时刻的入库、出库流量;2)泄流能力约束q(i,t)≤q(i,Z(i,t))(4);其中,q(i,Z(i,t))为第i水库第t时刻对应水位Z(i,t)的泄流能力;3)最高水位约束Z(i,t)≤Z(i,t)max(5);其中,Z(i,t)max为第i水库第t时刻允许达到的最高水位;4)期末水位约束Z(i,end)=Z(i,con)(6);其中,Z(i,end)为第i水库调度期末计算水位;Z(i,con)为第i水库期末控制水位;5)泄流变幅约束|q(i,t)-q(i,t-1)|≤Δq(i)(7);其中,q(i,t-1)为第i水库t-1时刻的出库流量;Δq(i)为第i水库出库流量最大变幅;(22)生成训练及验证样本集:假设防洪系统中共有M座防洪工程,选取历史L场流域性洪水,其中L1场洪水用于模型训练,L2场洪水用于模型验证;计算每场洪水中各工程输入属性集各属性值;由上述建立的“混合等效调度”模型,采用逐步减库法确定每场洪水中显效工程,记为“1”,与非显效工程,记为“0”;由此得共有|S|个样本的训练集S(C,D),|S|=M×L1,其中,C={Cj}(j∈[1,N])为特征属性;D={Du}(u=0,1)为类别属性,即工程由逐步减库法辨识的类别。进一步的,步骤(3)包括以下步骤:(31)确定随机森林基分类器数目Z,采用bagging方法在训练样本集S中随机抽取产生Z个训练样本子集作为各基分类器的训练集;(32)采用Forest-RI方法进行属性随机选择,得到各基分类器的特征属性子集k∈[1,Z];(33)基于Gini不纯度最小准则,由CART算法进行节点分裂生成单棵决策树,作为随机森林基分类器,表示为:h(x,Θe)(8);其中,h(x,Θe)表示第e棵决策树;x为输入变量;Θe为独立同分布的随机变量,表示单棵决策树所采用的参数集。进一步的,步骤(4)中建立包含Z棵决策树的随机森林,表示为{h1(x),h2(x),…,hZ(x)},由随机森林进行显效工程辨识,首先通过基分类器进行工程属性判别,最后通过投票法这一结合策略将基分类器结果结合得出最终分类结果,并得到第λ个样本属于Du类的概率Pλu。进一步的,步骤(5)包括以下步骤:(51)令显效工程为正类,记为“1”,非显效工程为负类,记为“0”;逐步减库法辨识的工程属性为真实类别,随机森林分类模型辨识的工程属性为预测类别;costαβ为把α类样本误判为β类的代价;则正确分类的代价cost11=0,cost00=0,把负类预测为正类的代价为cost01,把正类预测为负类的代价为cost10;(52)统计L2场验证洪水辨识结果每类工程样本数,把正类预测为正类的样本数为真正例TP,把正类预测为负类的样本数为假负例FN,把负类预测为正类的样本数为假正例FP,把负类预测为负类的样本数为真负例TN;(53)正例概率表示为p,负例概率表示为1-p;归一化正例概率代价为:归一化期望代价为:其中,(54)以归一化正例概率代价为横坐标、归一化期望代价为纵坐标绘制代价曲线:将各样本属于“正类”的概率Pλ1由大到小排序,并依次将其作为阈值,记为θη,θη表示排序后第η个样本属于“正类”的概率;按θη判断水库性质,若Pλ本文档来自技高网
...

【技术保护点】
1.一种基于随机森林的防洪系统显效工程智能辨识方法,其特征在于,包括以下步骤:/n(1)建立随机森林特征属性集;/n(2)建立防洪系统“混合等效调度”模型,生成训练及验证样本集;/n(3)基于“随机”思想构建随机森林基分类器;/n(4)基于“集成”思想构建随机森林分类模型;/n(5)建立考虑不均等代价的分类精度评价指标,评价显效工程辨识精度。/n

【技术特征摘要】
1.一种基于随机森林的防洪系统显效工程智能辨识方法,其特征在于,包括以下步骤:
(1)建立随机森林特征属性集;
(2)建立防洪系统“混合等效调度”模型,生成训练及验证样本集;
(3)基于“随机”思想构建随机森林基分类器;
(4)基于“集成”思想构建随机森林分类模型;
(5)建立考虑不均等代价的分类精度评价指标,评价显效工程辨识精度。


2.根据权利要求1所述的一种基于随机森林的防洪系统显效工程智能辨识方法,其特征在于,步骤(1)中充分考虑防洪系统实时水、雨、工情信息,选取防洪工程控制流域预测来水量、被补偿区间来水量、工程防洪压力、防洪点洪量贡献值、防洪点洪峰贡献值、防洪点洪水重叠度、工程间洪水重叠度为随机森林特征属性集。


3.根据权利要求1所述的一种基于随机森林的防洪系统显效工程智能辨识方法,其特征在于,步骤(2)包括以下步骤:
(21)所述防洪系统“混合等效调度”模型分为以最大削峰准则为目标的非显效工程单独优化调度和以防洪点洪峰流量最小为目标的显效工程联合优化调度;
单独优化调度目标函数为:
minF1=max(q(t))(1);
其中,q(t)为t时刻水库出库流量;
联合优化调度目标函数为:



其中,M1为显效水库数目;q'(i,t)为第i库出库流量在公共防洪点响应过程;q'区(i,t)为各显效水库私有防洪点上游区间来水在公共防洪点的响应过程;q'区s(t)为公共防洪点上游区间来水在公共防洪点的响应过程;
约束条件包括:
1)水量平衡约束
V(i,t)=V(i,t-1)+(Q(i,t)-q(i,t))·Δt(3);
其中,V(i,t-1)、V(i,t)分别为第i水库t-1时刻和t时刻的蓄水量;Q(i,t)和q(i,t)分别为第i水库t时刻的入库、出库流量;
2)泄流能力约束
q(i,t)≤q(i,Z(i,t))(4);
其中,q(i,Z(i,t))为第i水库第t时刻对应水位Z(i,t)的泄流能力;
3)最高水位约束
Z(i,t)≤Z(i,t)max(5);
其中,Z(i,t)max为第i水库第t时刻允许达到的最高水位;
4)期末水位约束
Z(i,end)=Z(i,con)(6);
其中,Z(i,end)为第i水库调度期末计算水位;Z(i,con)为第i水库期末控制水位;
5)泄流变幅约束
|q(i,t)-q(i,t-1)|≤Δq(i)(7);
其中,q(i,t-1)为第i水库t-1时刻的出库流量;Δq(i)为第i水库出库流量最大变幅;
(22)生成训练及验证样本集:
假设防洪系统中共有M座防洪工程,选取历史L场流域性洪水,其中L1场洪水用于模型训练,L2场洪水用于模型验证;计算每场洪水中各工程输入属性集各属性值;由上述建立的“混合等效调度”模型,采用逐步减库法确定每场洪水中显效工程,记为“1”,与非显效工程,记为“0”;由此得共有|S|个样本的训练集S(C,D),...

【专利技术属性】
技术研发人员:李洁玉钟平安邴建平杨敏芝付吉斯卢庆文马昱斐肖尧
申请(专利权)人:河海大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1