当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于机器学习和云模型的分类洪水随机预报方法技术

技术编号:36781131 阅读:27 留言:0更新日期:2023-03-08 22:15
本发明专利技术公开了一种基于机器学习和云模型的分类洪水随机预报方法,步骤如下:以历史典型场次洪水作为模型率定与检验的基础资料,选取满足条件的分类指标,基于自组织映射神经网络SOM进行历史场次洪水分类;采用最大信息系数方法MIC进行分类洪水影响因子筛选,并建立基于不同机器学习方法的分类洪水预报模型;针对不同类型洪水,基于云模型求解不同预报模型的融合权重,对各模型的模拟结果进行加权获取模型集成预报结果;分析计算相对预报误差,基于Copula方法建立相邻时刻相对预报误差联合分布函数;最后获取在线洪水实时信息,实现洪水随机预报。本发明专利技术可提高洪水预报精度,可为水文预测预报提供一种新的途径。水文预测预报提供一种新的途径。水文预测预报提供一种新的途径。

【技术实现步骤摘要】
一种基于机器学习和云模型的分类洪水随机预报方法


[0001]本专利技术属于水文预报
,具体涉及一种基于机器学习和云模型的分类洪水随机预报方法。

技术介绍

[0002]准确及时的洪水预报有利于制定科学合理的水利工程调度方案,保证流域水安全,具有重要的经济和社会效益。近年来,机器学习因其较强非线性拟合能力、模型搭建简单,在水文预报领域备受关注。采用以人工神经网络为代表的机器学习模型作为水文预报模型,已经成为一种稳定有效的预报手段。然而,考虑到单个模型结构不确定性对预报结果影响较大,国内外学者提出了多模型组合预报的概念。主要应用类似于简单平均法、神经网络模型和贝叶斯模型平均等方法,实现多个模型预报结果的综合,以此提高整体预报精度。但是这些方法主要是从模型模拟精度来进行融合权重的计算,未考虑模型分布之间的相似性。原则上,无论水文预报技术如何提高,预报误差总是难以避免,然而目前大部分不确定性随机模拟未考虑前后预报时刻误差之间的关联性。

技术实现思路

[0003]针对不同模型预报结果具有不确定性的特点,且一般考虑预报误差的洪水预报过程未考虑预报时刻前后关联性等缺陷,本专利技术提出一种基于机器学习和云模型的分类洪水随机预报方法,能够提高洪水预报精度。
[0004]本专利技术采用以下技术方案:
[0005]一种基于机器学习和云模型的分类洪水随机预报方法,包括以下步骤:
[0006]Step 1:以历史典型场次洪水作为模型率定与检验的基础资料,选取满足条件的分类指标,基于自组织映射神经网络(SOM)进行历史场次洪水分类;
[0007]Step 2:采用最大信息系数方法(MIC)进行分类洪水影响因子筛选,并建立基于不同机器学习方法的分类洪水预报模型,获得不同模型对应各类洪水的最优参数;
[0008]Step 3:针对不同类型洪水,基于云模型求解不同预报模型的融合权重,对各模型的模拟结果进行加权获取分类洪水模型集成预报结果;
[0009]Step 4:分析计算预报相对误差,基于Copula方法建立相邻时刻相对预报误差联合分布函数,确定相对预报误差累积概率分布函数;
[0010]Step 5:获取在线洪水实时信息,实现洪水随机预报。
[0011]上述技术方案中,进一步地,所述Step1中分类指标包含降雨总量、最大三小时降雨、降雨强度、降雨中心、前期影响雨量和洪峰中的一种或多种。
[0012]进一步地,所述Step2中分别采用最大信息系数方法MIC进行影响因子筛选,包括以下方法:针对不同类型洪水,以t时刻预报降雨P
t
以及前期降雨{P
t

N
,P
t

N+1
,P
t

N+2
,

,P
t
‑1}作为待选预报因子集合,基于最大信息系数方法MIC计算当前时刻流量Q
t
与不同待选预报因子的相关性(MIC值),选择MIC值大于0.30的待选预报因子作为预报模型输入;
[0013]进一步地,所述Step2建立基于不同机器学习方法的分类洪水预报模型,包括以下步骤:
[0014]Step2

1:将洪水序列按照场次洪水划分为训练期和验证期,以Step2获得的MIC值大于0.30的待选预报因子作为模型输入,场次洪水作为模型输出,并将所有数据集归一化至(0,1]区间;
[0015]Step2

2:建立基于不同机器学习方法的预报模型{M1,M2,

,M
K
}(K≥2),输出模型结果,反归一化后得到模拟径流值其中,表示第i个预报模型第t时刻的模拟值,i=1,2,

,K,K为预报模型的个数,T为不同场次洪水的时间长度(h);
[0016]Step2

3:对比训练集次洪观测值其中,表示第t时刻的观测值,选择相关系数(R)、纳什系数(NSE)、平均绝对误差(MAE)和均方根误差(RMSE)作为评价指标,采用网格法对不同机器学习模型参数进行优选;
[0017]Step2

4:将验证集数据输入训练好的模型中获得模拟结果,反归一化后得到径流模拟值以相关系数、纳什系数、平均绝对误差和均方根误差作为评价指标,判断模型的模拟结果是否合格。
[0018]进一步地,所述Step2

1机器学习方法包含神经网络模型、支持向量机模型、长短期记忆网络模型、门循环单元模型和极度梯度提升树中的两种或两种以上。
[0019]进一步地,所述Step3中基于云模型求解不同预报模型的融合权重,对各模型的模拟结果进行加权获取模型集成预报结果,包括以下步骤:
[0020]Step3

1:选取训练期内的观测值和模拟值,基于逆向正态云发生器建立相应云模型对(Cq
sim,i
,Cq
obs
),将序列的分布特征转化为对应的数字特征,其中,Cq
sim,i
表示第i个预报模型模拟值构造的云模型期望曲线,Cq
obs
表示观测值构造的云模型期望曲线;
[0021]Step3

2:基于云模型期望曲线重叠度分别计算不同预报模型模拟值和观测值的全局相似度S
i
(Q
sim,i
,Q
obs
):
[0022]S
i
(Q
sim,i
,Q
obs
)=sim(Cq
sim,i
,Cq
obs
)
ꢀꢀꢀ
(1)
[0023]Step3

3:由全局相似度S
i
(Q
sim,i
,Q
obs
)求解各预报模型的融合权重w
i

[0024][0025]Step3

4:对各模型的模拟结果进行加权组合,得到模型集成预报结果:
[0026][0027]式中,表示第i个预报模型第t时刻的模拟值,i=1,2,

,K,K为预报模型个数,K≥2。
[0028]进一步地,所述Step3

4的模型集成预报结果选择相关系数(R)、纳什系数(NSE)、平均绝对误差(MAE)和均方根误差(RMSE)作为评价指标,判断集成预报结果是否合格。
[0029]进一步地,所述Step4分析计算相对预报误差,基于Copula方法建立相邻时刻相对
预报误差联合分布函数,包括以下步骤:
[0030]Step4

1:假设径流预报相对误差为构建径流预报相对误差分布作为边缘分布,分别基于不同Copula函数建立前后时刻的联合分布,采用最大似然估计本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习和云模型的分类洪水随机预报方法,其特征在于,包括以下步骤:Step 1:以历史典型场次洪水作为模型率定与检验的基础资料,选取分类指标,基于自组织映射神经网络SOM进行历史场次洪水分类,其中分类指标为降雨总量、最大三小时降雨、降雨强度、降雨中心、前期影响雨量、洪峰中的一种或多种;Step 2:采用最大信息系数方法MIC进行不同类型洪水的洪水影响因子筛选,并建立基于不同机器学习方法的分类洪水预报模型,获得不同模型对应各类洪水的最优参数;Step 3:针对不同类型洪水,基于云模型求解不同预报模型的融合权重,基于融合权重对各模型的模拟结果进行加权获取模型集成预报结果;Step 4:分析计算相对预报误差,基于Copula方法建立相邻时刻相对预报误差联合分布函数,确定相对预报误差累积概率分布函数;Step 5:获取在线洪水实时信息,实现洪水随机预报。2.如权利要求1所述的基于一种基于机器学习和云模型的分类洪水随机预报方法,其特征在于,所述Step2中采用最大信息系数方法MIC进行影响因子筛选,包括以下方法:针对不同类型洪水,分析选定t时刻预报降雨P
t
以及前期降雨{P
t

N
,P
t

N+1
,P
t

N+2
,

,P
t
‑1}作为待选预报因子集合;基于MIC方法计算当前时刻流量Q
t
与不同待选预报因子的相关性,即MIC值,选择MIC值大于0.30的待选预报因子作为预报模型的输入。3.如权利要求2所述的基于一种基于机器学习和云模型的分类洪水随机预报方法,其特征在于,所述Step2中建立基于不同机器学习方法的分类洪水预报模型,包括以下步骤:Step2

1:将洪水序列按照场次洪水划分为训练集和验证集,以MIC值大于0.30的待选预报因子作为模型输入,场次洪水作为模型输出,并将所有数据集归一化至(0,1]区间;Step2

2:建立基于不同机器学习方法的预报模型{M1,M2,

M
i
,

M
K
},i=1,2,

,K,K≥2,其中机器学习方法为神经网络模型ANN、支持向量机模型SVM、长短期记忆网络模型LSTM、门循环单元模型GRU和极度梯度提升树XGBoost中的两种或两种以上;计算模型输出结果,反归一化后得到径流模拟值其中,表示第i个预报模型第t时刻的模拟值,i=1,2,

,K,K为预报模型的个数,T为不同场次洪水的时间长度,h;Step2

3:对比训练集次洪观测值其中,表示第t时刻的观测值,以相关系数、纳什系数、均方根误差和平均绝对误差作为评价指标,采用网格法对不同机器学习模型参数进行优选;Step2

4:将验证集数据输入训练好的模型中获得模拟结果,反归一化后得到径流模拟值以相关系数、纳什系数、平均绝对误差和均方根误差作为评价指标,判断模型的模拟结果是否合格。4.如权利要求3所述的基于一种基于机器学习和云模型的分类洪水随机预报方法,其特征在于,所述Step3中,基于云模型求解不同预报模型的融合权重,基于融合权重对各模型的模拟结果进行加权获取模型集成预报结果,包括以下步骤:Step3

1:选取训练集内的观测值和模拟值,基于逆向正态云发生器建立相应云模型对(Cq
sim,i
,Cq
obs
),从而将序列的分布特征转化为对应的数字特征,其中,Cq
sim,i
表示第i个预报模型模拟值构造的云模型期望曲线,Cq
obs
表示观测值构造的云模型期望曲线;Step3

2:基于云模型期望...

【专利技术属性】
技术研发人员:郭玉雪许月萍于欣廷刘莉
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1