一种径流概率预报方法技术

技术编号:20364625 阅读:21 留言:0更新日期:2019-02-16 17:18
本发明专利技术公开一种径流概率预报方法,其中,该方法主要包括:采用基于K‑medoids的聚类方法对训练集进行聚类,得到隐含马尔科夫模型HMM的初始化参数;利用Baum–Welch算法对HMM进行学习,得到HMM的状态转移概率矩阵以及观测模型的概率分布;根据贝叶斯信息准则BIC进行模型选择,选择适宜该训练集的HMM状态个数;最终根据给出的预报因子,结合高斯混合回归GMR推理得到条件概率分布函数作为径流概率预报。本发明专利技术的概率预报方法引入了径流隐含状态的概念,可利用水文、地形、气象等诸多因素训练得到隐含状态转移概率矩阵,得到有效可靠的未来径流概率预报分布,为水库优化调度决策提供科学依据。

【技术实现步骤摘要】
一种径流概率预报方法
本专利技术涉及水文水资源领域,更具体地,涉及一种径流概率预报方法。
技术介绍
径流预报能够在防洪、供水、发电等水库调度运行管理的各个方面发挥重要作用。高精度并且可靠的预报能为流域梯级水库优化调度决策提供科学依据,对流域水资源合理利用具有重大意义。然而,降雨径流的形成过程受到水文、地形、气象等诸多自然因素的影响,呈现高度的非线性、随机性和不确定性特征,给径流预测带来了困难,难以采用传统的方法开展径流预测。因此,如何构建考虑诸多影响径流过程的隐含因素的预测模型是亟需解决的理论和实际工程问题。隐含马尔科夫模型(hiddenMarkovmodel,HMM)由隐含状态序列以及其对应的观测模型构成,其中隐含状态序列是一个典型的马尔科夫链,具有无后效性,对应的观测模型满足独立输出假设:观测模型跟当前隐含状态相关且仅跟当前隐含状态相关。可将隐含马尔科夫模型运用于水文的径流预报当中,视前期径流、土壤、气象等因素为隐含状态序列,对应的径流过程为观测概率模型,能够充分模拟具有非线性、随机性和不确定性的历史径流过程。如何通过训练后的隐含马尔科夫模型来预测未来的径流序列是目前所需解决的问题。
技术实现思路
针对现有技术的缺陷,本专利技术的目的在于解决现有降雨径流的形成过程受到水文、地形、气象等诸多自然因素的影响,呈现高度的非线性、随机性和不确定性特征,给径流预测带来了困难,难以采用传统的方法开展径流预测,以及如何通过训练后的隐含马尔科夫模型来预测未来的径流序列的技术问题。为实现上述目的,本专利技术提供一种径流概率预报方法,包括如下步骤:(1)构建由预报径流和其预报因子组成的数据集,对数据进行归一化处理得到训练集;(2)基于K-medoids的聚类方法对训练集进行聚类,根据聚类后得到的各类的均值向量、协方差矩阵以及径流状态转移概率矩阵作为隐含马尔科夫模型的初始化参数,所述隐含马尔科夫模型包括隐含状态序列及其对应的观测模型;(3)利用Baum–Welch算法对隐含马尔科夫模型进行学习,得到训练后的隐含马尔科夫模型径流状态转移概率矩阵以及观测模型的概率分布;(4)设置不同的隐含状态个数K=1~15;重复步骤(2)-(3),并计算相应的贝叶斯信息准则值;(5)选择贝叶斯信息准则值最小值所对应的K值,作为隐含马尔科夫模型隐含个数;(6)根据训练得到的隐含马尔科夫模型,结合高斯混合回归(GaussianMixtureRegression,GMR)方法,利用观测模型的概率分布以及测试集所给的预报因子得到各径流隐含状态下径流条件概率分布,利用径流状态转移概率矩阵求解测试集中每个时间节点落在K个径流隐含状态下的概率,综合推导得到测试集的条件概率分布函数,作为对测试集的径流概率预报结果。可选地,步骤(2)中K-medoids算法使用核函数代替欧几里得距离来度量两个数据点之间的相似性;从训练集包括的数据点中随机选择K个中心点,当更新中心点时,每个数据点被分类为与中心点最相似的类别,并且计算每个数据点与其相同类别所有数据点的相似度,选择相似度最高的数据点作为此类别的新的中心点。可选地,步骤(3)包括:E步骤:根据现有的隐含马尔科夫模型,计算各个观测数据输入到模型中的计算结果,确定完全数据的对数似然函数:其中,Q(θ,θold)表示对数似然函数,θ表示隐含马尔科夫模型的所有参数集θ={π,A,φ},θold表示更新前的参数值,t表示数据集的索引,1≤t≤T,T表示数据集个数,πk表示隐含马尔科夫模型在k状态的初始概率,1≤k≤K,K表示隐含状态个数,Aij表示从状态i转移到状态j的概率,φk表示第k个观测概率模型的参数,p(xt|φk)表示第t个观测数据点在第k个观测概率模型下的条件概率值;γt(k)表示观测数据在时刻t处于第k个状态变量的概率,其概率计算公式如下:其中,X表示所有观测数据,zt表示t时刻的状态;ξt(i,j)表示观测数据在时刻t-1处于第i个状态且在时刻t处于第j个状态的概率,其概率计算公式如下:M步骤:根据以上E步骤得到的参状态参数γt(k)和ξt(i,j),对隐含马尔科夫模型的参数θ={π,A,φ}进行重估计,假设隐含马尔科夫模型中观测概率模型为高斯分布,则φk={μk,∑k},新的参数估计值由下式给出:可选地,步骤(4)中贝叶斯信息准则值通过以下公式计算:其中,表示模型的极大似然值,np表示模型参数个数,隐含状态个数不同则对应的模型极大似然数和模型参数个数均不同。可选地,步骤(6)包括:在预报的过程中,对于每个隐含状态,观测概率模型的均值向量μk将按照预报因子、预报变量进行拆分:其中,为表示预报因子均值的子向量,为表示预报变量均值的子向量,与此同时,协方差矩阵也被拆分:其中,表示预报因子之间的协方差矩阵,表示预报因子与预报变量的协方差矩阵,表示预报变量与预报因子的协方差矩阵,表示预报变量之间的协方差矩阵;根据联合正态分布的性质推理,给定预报因子yt后,预报值的条件概率服从联合正态分布,其均值向量和协方差矩阵如下:在原始的高斯混合回归框架中,不同高斯观测模型的权重hk表示为每个观测值属于第k个高斯观测模型的比重;通过递归计算来估计此权重值,从而不仅考虑预报因子,而且还考虑封装在隐含马尔科夫模型中的时间序列信息:其中,hk(yt)表示隐含马尔科夫模型前向变量,表示高斯分布的条件概率值;对于隐含马尔科夫模型,具有K个隐含状态对应的高斯观测模型,因此,给定预报因子yt的情况下,预报变量zt的条件概率分布函数p(zt|yt)为:其中,表示第k个隐含状态下zt的条件概率分布函数。总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,具有以下有益效果:本专利技术提供的一种基于隐含马尔科夫模型结合高斯混合回归的径流预报方法,将隐含马尔科夫模型运用与水文的径流预报当中,视前期径流、土壤、气象等因素为隐含状态序列,对应的径流过程为观测概率模型,能够充分的模拟具有非线性、随机性和不确定性的历史径流过程。混合高斯回归是一种概率密度估计的方法,其主要作用是通过联合概率密度函数衍生出该联合概率密度函数的条件概率密度函数作为预报概率。研究将此权重值推广到隐含马尔科夫模型中,通过递归计算来估计权重值,不仅考虑预报因子,而且还考虑封装在HMM中的时间序列信息。附图说明图1为本专利技术提供的隐含马尔科夫模型结合高斯回归预报方法整体流程图;图2为本专利技术提供的小湾水库来水预报值、90%预报区间与实际径流对比示意图;图3为本专利技术提供的小湾水库来水预报概率积分转换(PIT)统计图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。此外,下面所描述的本专利技术各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。混合高斯回归是一种概率密度估计的方法,其主要作用是通过联合概率密度函数衍生出该联合概率密度函数的条件概率密度函数作为预报概率,一般运用于混合模型的预测中,而隐含马尔科夫模型可以视为一种条件混合模型,因此可将混合高斯回归拓展到隐含马尔科夫模型作为预测方法。本专利技术提供一种基于隐含马尔科夫模型结合高斯混合回归的径流预本文档来自技高网...

【技术保护点】
1.一种径流概率预报方法,其特征在于,包括如下步骤:(1)构建由预报径流和其预报因子组成的数据集,对数据进行归一化处理得到训练集;(2)基于K‑medoids的聚类方法对训练集进行聚类,根据聚类后得到的各类的均值向量、协方差矩阵以及径流状态转移概率矩阵作为隐含马尔科夫模型的初始化参数,所述隐含马尔科夫模型包括隐含状态序列及其对应的观测模型;(3)利用Baum–Welch算法对隐含马尔科夫模型进行学习,得到训练后的隐含马尔科夫模型径流状态转移概率矩阵以及观测模型的概率分布;(4)设置不同的隐含状态个数K=1~15;重复步骤(2)‑(3),并计算相应的贝叶斯信息准则值;(5)选择贝叶斯信息准则值最小值所对应的K值,作为隐含马尔科夫模型隐含个数;(6)根据训练得到的隐含马尔科夫模型,结合高斯混合回归方法,利用观测模型的概率分布以及测试集所给的预报因子得到各径流隐含状态下径流条件概率分布,利用径流状态转移概率矩阵求解测试集中每个时间节点落在K个径流隐含状态下的概率,综合推导得到测试集的条件概率分布函数,作为对测试集的径流概率预报结果。

【技术特征摘要】
1.一种径流概率预报方法,其特征在于,包括如下步骤:(1)构建由预报径流和其预报因子组成的数据集,对数据进行归一化处理得到训练集;(2)基于K-medoids的聚类方法对训练集进行聚类,根据聚类后得到的各类的均值向量、协方差矩阵以及径流状态转移概率矩阵作为隐含马尔科夫模型的初始化参数,所述隐含马尔科夫模型包括隐含状态序列及其对应的观测模型;(3)利用Baum–Welch算法对隐含马尔科夫模型进行学习,得到训练后的隐含马尔科夫模型径流状态转移概率矩阵以及观测模型的概率分布;(4)设置不同的隐含状态个数K=1~15;重复步骤(2)-(3),并计算相应的贝叶斯信息准则值;(5)选择贝叶斯信息准则值最小值所对应的K值,作为隐含马尔科夫模型隐含个数;(6)根据训练得到的隐含马尔科夫模型,结合高斯混合回归方法,利用观测模型的概率分布以及测试集所给的预报因子得到各径流隐含状态下径流条件概率分布,利用径流状态转移概率矩阵求解测试集中每个时间节点落在K个径流隐含状态下的概率,综合推导得到测试集的条件概率分布函数,作为对测试集的径流概率预报结果。2.根据权利要求1所述的径流概率预报方法,其特征在于,所述步骤(2)中K-medoids算法使用核函数代替欧几里得距离来度量两个数据点之间的相似性;从训练集包括的数据点中随机选择K个中心点,当更新中心点时,每个数据点被分类为与中心点最相似的类别,并且计算每个数据点与其相同类别所有数据点的相似度,选择相似度最高的数据点作为此类别的新的中心点。3.根据权利要求1所述的径流概率预报方法,其特征在于,所述步骤(3)包括:E步骤:根据现有的隐含马尔科夫模型,计算各个观测数据输入到模型中的计算结果,确定完全数据的对数似然函数:其中,Q(θ,θold)表示对数似然函数,θ表示隐含马尔科夫模型的所有参数集θ={π,A,φ},θold表示更新前的参数值,t表示数据集的索引,1≤t≤T,T表示数据集个数,πk表示隐含马尔科夫模型在k状态的初始概率,1≤k≤K,K表示隐含状态个数,Aij表示从状态i转移到状态j的...

【专利技术属性】
技术研发人员:覃晖刘永琦王永强莫莉蒋志强周建中张振东银星黎李杰卢建涛成良歌
申请(专利权)人:华中科技大学长江水利委员会长江科学院
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1