当前位置: 首页 > 专利查询>河海大学专利>正文

融合栈式自编码器和支持向量回归的洪水预测方法技术

技术编号:20177933 阅读:31 留言:0更新日期:2019-01-23 00:43
本发明专利技术公开了融合栈式自编码器和支持向量回归的洪水预测方法,该方法首先通过SOM聚类对原始水文数据进行分类;然后采用逐层贪婪训练方法训练网络,利用聚类后的每一样本集训练各自的第一个稀疏编码器,得到第一层特征;随后利用第一层特征训练第二个稀疏的自动编码器,以此类推,直至完成第N层的SAE训练;将SAE最深隐藏层的输出作为SVR的输入,训练SVR模型;比较SVR输出与实际值间的误差调整整个SAE‑SVR模型参数;最后测试集经SOM聚类,用优化的SAE‑SVR模型进行预测。本发明专利技术综合了SAE在提取数据特征方面与SVR对时间序列预测方面的优点,对洪水的预测具有良好的准确性。

Flood forecasting method based on stack self-encoder and support vector regression

The invention discloses a flood forecasting method combining stack self-encoder and support vector regression, which first classifies the original hydrological data by SOM clustering, then trains the network by layer-by-layer greedy training method, trains the first sparse encoder of each sample set after clustering, and obtains the first layer features; and then trains the second layer sparse by using the first layer features. Sparse automatic encoder, and so on, until the completion of SAE training in layer N; the output of the deepest hidden layer of SAE is used as the input of SVR to train the SVR model; the error between the output of SVR and the actual value is compared to adjust the parameters of the whole SAE SVR model; finally, the test set is clustered by SOM and predicted by the optimized SAE SVR model. The invention integrates the advantages of SAE in extracting data characteristics and SVR in time series prediction, and has good accuracy in flood prediction.

【技术实现步骤摘要】
融合栈式自编码器和支持向量回归的洪水预测方法
本专利技术涉及洪水预测方法,特别是涉及融合栈式自编码器和支持向量回归的洪水预测方法,属于水利防灾减灾

技术介绍
洪水预报是管理洪水的少数可行方案之一,也是防汛抢险的决策依据,其时效性和准确性显得极其重要。在过去,基于物理或概念的水文模型已经得到了充分的研究与发展;今天,得益于水文数据获取能力的提高、数据管理和建模工具的完善以及智能计算、机器学习领域的发展,如何有效地利用现有的资源挖掘出水文和气象数据中蕴含的有用信息,提高洪水预报的准确率,是一个重要的研究方向,因而数据驱动方法在洪水预报领域受到了越来越多的关注。与传统的水文模型不同,数据驱动建模不需要考虑水文过程的物理机制,而是建立关于时间序列的数学分析,通过学习给定样本,发现系统输入和输出之间的映射关系,即水文变量间的统计或因果关系。这类模型包含很多复杂的方法,如自回归滑动平均(ARMA)模型、人工神经网络(ANN)、支持向量机(SVM)等。数据驱动模型在解决数值预测问题、重建高度非线性函数、分类、时间序列分析等方面有着独特的优越性,因而在洪水预报领域中也被广泛的应用。对于数据驱动模型,通常使用大量数据进行训练与预测,而许多算法对大数据集并没有展现优良的性能。为了克服各数据驱动模型在性能上的缺陷,当代趋势是将不同模型结合,以实现优缺点互补。如Chang等(ChangFJ,LiangJM,ChenYC,“Floodforecastingusingradialbasisfunctionneuralnetworks”.IEEETransactionsonSystemsMan&CyberneticsPartC,2001,31(4):530-535)提出基于模糊聚类的RBF神经网络以构建降雨-径流模型,减少了训练时间;葛文军等(葛文军,邢贞相,“改进的BP神经网络在洪水过程预报中的应用”.水利科技与经济,2006,12(3):166-167)采用遗传算法(GA)先对网络结构和初始权值进行全局优化,建立了基于GA-BP的宜昌站洪水预报模型,有效避免了局部最优;Tehrany等(TehranyMS,PradhanB,JeburMN,“Floodsusceptibilitymappingusinganovelensembleweights-of-evidenceandsupportvectormachinemodelsinGIS”.JournalofHydrology,2014,512(6):332-343)以马来西亚瓜拉丁加奴盆地为研究目标,提出基于GIS的WoE(weights-of-evidence)-SVM组合模型。对于数据驱动方法,通常需要大数据集对模型进行训练与优化,然而许多算法对大数据集并没有取得优良的效果。从技术上讲,解决大数据集的一种常用方法是将输入数据分成更小的群集,然后将学习算法应用到每个群集并综合模拟研究。因此,自组织映射网络(SOM)通常用于将整个输入空间分解成统计分布相似的数据点被分组在一起的区域,以便捕获输入变量的非平稳性质,即SOM一旦得到训练,它就会将具有相似特征的数据点映射到输出层中的相同神经元。例如HallandMinns(HallMJ,MinnsAW.“Theclassificationofhydrologicallyhomogeneousregions”.InternationalAssociationofScientificHydrologyBulletin,1999,44(5):693-704)根据每个测量点流域面积、主干流长度、主干流坡度的特征,采用SOM算法对英格兰南部和威尔士南部的测点进行区域化。发展至今,许多组合模型从不同方面对已有模型进行了改进且取得了良好的效果,但是对于非凸优化的问题仍非常难求解,其仍不能超过一至二个隐藏层。栈式自编码(StackedAutoEncoder,SAE)可以很好的解决这一问题,其拥有深度提取数据集特征的能力,由多层稀疏自动编码组成,前一层自编码器的输出作为其后一层自编码器的输入。SAE还采用稀疏性限制,在进行反向传递时加以限制。SAE通过降维处理减小了模型的复杂程度。因此,可以集成自组织映射网络、栈式自编码和支持向量回归(SVR)算法,通过SOM对所有数据进行分类,然后使用SAE对相应类别的数据进行特征提取,最后使用径向基函数(RBF)进行高维投影,实现非线性映射。这种集成方法,使得在非线性问题得到很好的解决的同时,预测也得到了良好的结果。数据驱动方法基于客观信息建模,它们在数据具有代表性和正确建模的前提下,结果可能比物理、概念模型更精确。随着大数据量、不同类型流域、不同水文要素的应用分析研究,以及与不同水文预报模型的组合应用研究,加之作业洪水预报中的实践检验,数据驱动方法在水文预报领域中的应用将更趋完善。
技术实现思路
本专利技术所要解决的技术问题是:提供融合栈式自编码器和支持向量回归的洪水预测方法,为洪水预测问题提供了一种可靠的模型。本专利技术为解决上述技术问题采用以下技术方案:融合栈式自编码器和支持向量回归的洪水预测方法,包括如下步骤:步骤1,获取SAE-SVR深度模型的输入、输出变量,构成训练样本,其中,输入变量为当前站点n个时刻的流域降雨量、流量,以及当前站点上游S个站点n个时刻的流域降雨量、流量,构成输入变量矩阵为X=(xij)n×P,P=S×BIF+CIF,CIF为当前站点选择的影响因子数量,BIF为当前站点上游S个站点中各站点选择的影响因子数量,xij为输入变量矩阵X的元素;输出变量为n个时刻中各时刻h小时后当前站点的流量,构成输出变量矩阵为Y=(yi)n×1,yi为输出变量矩阵Y的元素;采用均值方差归一化方法对输入、输出变量矩阵做预处理;步骤2,将归一化后的输入变量矩阵通过SOM聚类方法划分为K个不同的类别,每个类别表示为Xclusterk,1≤k≤K;步骤3,利用步骤2得到的每个类别Xclusterk,通过逐层贪婪训练具有N个隐藏层的栈式自编码器,得到栈式自编码器最深隐藏层的输出特征,将栈式自编码器最深隐藏层的输出特征作为支持向量回归算法的输入,训练支持向量回归模型,得到SAE-SVR深度模型;步骤4,将SAE-SVR深度模型的输出值与归一化后的输出变量矩阵的实际值进行误差比较,并调整SAE-SVR深度模型的参数,得到优化后的SAE-SVR深度模型;步骤5,获取测试样本,包括当前站点的流域降雨量、流量,以及当前站点上游S个站点的流域降雨量、流量,对测试样本进行均值方差归一化处理,然后通过SOM聚类方法对归一化后的测试样本进行分类,最后用优化后的SAE-SVR深度模型对当前站点h小时后的流量进行预测。作为本专利技术的一种优选方案,所述步骤2的具体过程如下:2.1,初始化SOM聚类方法的参数,包括:输出神经元个数终止条件为训练次数达到tmax=munits/n×50,学习率改变方式为指数衰减法其中,n为输入变量矩阵的行数,munits为网格个数,ηinitial、ηfinal分别为学习率的初始值、最终值,t表示第t次训练;2.2,从归一化后的输入变量矩阵中,随机选择一行输入向量xi,i=1,…,n;2.3,计本文档来自技高网
...

【技术保护点】
1.融合栈式自编码器和支持向量回归的洪水预测方法,其特征在于,包括如下步骤:步骤1,获取SAE‑SVR深度模型的输入、输出变量,构成训练样本,其中,输入变量为当前站点n个时刻的流域降雨量、流量,以及当前站点上游S个站点n个时刻的流域降雨量、流量,构成输入变量矩阵为X=(xij)n×P,P=S×BIF+CIF,CIF为当前站点选择的影响因子数量,BIF为当前站点上游S个站点中各站点选择的影响因子数量,xij为输入变量矩阵X的元素;输出变量为n个时刻中各时刻h小时后当前站点的流量,构成输出变量矩阵为Y=(yi)n×1,yi为输出变量矩阵Y的元素;采用均值方差归一化方法对输入、输出变量矩阵做预处理;步骤2,将归一化后的输入变量矩阵通过SOM聚类方法划分为K个不同的类别,每个类别表示为Xcluster k,1≤k≤K;步骤3,利用步骤2得到的每个类别Xcluster k,通过逐层贪婪训练具有N个隐藏层的栈式自编码器,得到栈式自编码器最深隐藏层的输出特征,将栈式自编码器最深隐藏层的输出特征作为支持向量回归算法的输入,训练支持向量回归模型,得到SAE‑SVR深度模型;步骤4,将SAE‑SVR深度模型的输出值与归一化后的输出变量矩阵的实际值进行误差比较,并调整SAE‑SVR深度模型的参数,得到优化后的SAE‑SVR深度模型;步骤5,获取测试样本,包括当前站点的流域降雨量、流量,以及当前站点上游S个站点的流域降雨量、流量,对测试样本进行均值方差归一化处理,然后通过SOM聚类方法对归一化后的测试样本进行分类,最后用优化后的SAE‑SVR深度模型对当前站点h小时后的流量进行预测。...

【技术特征摘要】
1.融合栈式自编码器和支持向量回归的洪水预测方法,其特征在于,包括如下步骤:步骤1,获取SAE-SVR深度模型的输入、输出变量,构成训练样本,其中,输入变量为当前站点n个时刻的流域降雨量、流量,以及当前站点上游S个站点n个时刻的流域降雨量、流量,构成输入变量矩阵为X=(xij)n×P,P=S×BIF+CIF,CIF为当前站点选择的影响因子数量,BIF为当前站点上游S个站点中各站点选择的影响因子数量,xij为输入变量矩阵X的元素;输出变量为n个时刻中各时刻h小时后当前站点的流量,构成输出变量矩阵为Y=(yi)n×1,yi为输出变量矩阵Y的元素;采用均值方差归一化方法对输入、输出变量矩阵做预处理;步骤2,将归一化后的输入变量矩阵通过SOM聚类方法划分为K个不同的类别,每个类别表示为Xclusterk,1≤k≤K;步骤3,利用步骤2得到的每个类别Xclusterk,通过逐层贪婪训练具有N个隐藏层的栈式自编码器,得到栈式自编码器最深隐藏层的输出特征,将栈式自编码器最深隐藏层的输出特征作为支持向量回归算法的输入,训练支持向量回归模型,得到SAE-SVR深度模型;步骤4,将SAE-SVR深度模型的输出值与归一化后的输出变量矩阵的实际值进行误差比较,并调整SAE-SVR深度模型的参数,得到优化后的SAE-SVR深度模型;步骤5,获取测试样本,包括当前站点的流域降雨量、流量,以及当前站点上游S个站点的流域降雨量、流量,对测试样本进行均值方差归一化处理,然后通过SOM聚类方法对归一化后的测试样本进行分类,最后用优化后的SAE-SVR深度模型对当前站点h小时后的流量进行预测。2.根据权利要求1所述融合栈式自编码器和支持向量回归的洪水预测方法,其特征在于,所述步骤2的具体过程如下:2.1,初始化SOM聚类方法的参数,包括:输出神经元个数终止条件为训练次数达到tmax=munits/n×50,学习率改变方式为指数衰减法其中,n为输入变量矩阵的行数,munits为网格个数,ηinitial、ηfinal分别为学习率的初始值、最终值,t表示第t次训练;2.2,从归一化后的输入变量矩阵中,随机选择一行输入向量xi,i=1,…,n;2.3,计算输入向量xi与所有神经元的权向量之间的欧氏距离,将最小欧氏距离对应的神经元确定为获胜神经元;2.4,根据学习规则调整获胜神经元的权向量及其相邻神经元的权向量,公式为其中,Drr’=exp(-||r-r'||2/2σ2),分别为调整后、调整前神经元的权向量,η为SOM聚类方法的学习率,...

【专利技术属性】
技术研发人员:刘凡杨丽洁毛莺池许峰
申请(专利权)人:河海大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1