一种基于三维卷积神经网络的河流流量预测方法技术

技术编号:24168552 阅读:32 留言:0更新日期:2020-05-16 02:12
本发明专利技术公开了一种基于三维卷积神经网络的河流流量预测方法。为了克服基于数据驱动的预测模型对于可靠的数据仍然有较大的依赖性的问题;本发明专利技术包括以下步骤:S1:筛选与河流流量相关的特征因素来构建数据集;S2:生成时序数据样本,并对其进行预处理;S3:按比例随机划分训练集和验证集,搭建深度三维卷积神经网络,并使深度三维卷积神经网络在训练集上训练;S4:跟踪预测精度并自动保存当前最好的模型参数,在验证集上测试模型参数的性能指标;S5:进行未来n个小时的当前测站河流流量预测。通过探究气象、水文的不同因素之间的相关性,使得二维卷积核不受卷积核大小的局限及输入特征人为布局的影响。

A method of river flow prediction based on 3D convolution neural network

【技术实现步骤摘要】
一种基于三维卷积神经网络的河流流量预测方法
本专利技术涉及一种河流流量预测领域,尤其涉及一种基于多特征相关性的三维卷积神经网络河流流量预测方法。
技术介绍
中小河流,一般指流域面积从200~3000平方公里的河流区域。这类流域由于大多位于地势复杂多变的山地,难以部署基础测量设备,且流域洪水突发性强,难以提前预测并及时做好应急措施。其次,传统的基于物理模型的洪水预报方法需要根据大量观测资料数据确定模型参数,并且由于模型参数的独特性,难以推广并直接应用至其它流域的洪水预测。中小河流流域的洪水预测的巨大困难,给当地的经济,农业,居民人生安全带来了巨大隐患。因此,如何改进传统水文预报方法,缩短洪水报讯时间,并针对中小河流提高其洪水预报的准确性具有重要意义。传统的洪水预报方法通过对某一河流流域建立物理水文模型,借由数学物理模型描述或刻画流域的水循环动态过程,然后根据流域当地观测数据确定模型参数,得到完整的流域水文模型并应用于实际洪水预报。国内较为经典的水文模型有新安江模型,经过测试,其模型的结构和参数可以充分地反映湿润地区降雨径流过程。国外较为经典的水文模型如美国的Stanford模型等,也得到了广泛的应用。但是正如前文所述,传统的河流流域物理水文机理模型洪水预报方法存在以下缺点:物理水文模型的建立依赖于大量可观测的流域数据(包括流域集水区区域面积,流域地形地貌数据,流量,降雨量,蒸发量,土壤数据等)。物理模型的参数率定过程复杂且繁琐,需要上述资料数据以及大量的模拟计算,模拟计算的结果只有满足一定验证指标,才能确定最终的模型最优参数。此外,上述物理模涉及复杂的水文动态过程,模型建立和参数率定需有大量的人工干预过程。这些干预过程需要专业的水文知识,以及模型参数率定上的丰富经验。一旦物理水文模型的建立与实际情况存在较大偏差,将对未来的洪水流量预测产生难以估量的误差。由于可观测流域数据具有一定时效性,流域物理水文环境可能随时间而发生变化,导致之前建立的物理水文模型与实际出现偏差,需要重新进行参数率定。所设计的流域物理水文环境在当前流域预测精度高,但是因为实际水文动态环境的不同,难以直接推广至其它流域。21世纪以来,基于数据驱动的预测模型已经在水文领域有了广泛的应用,包括时间序列模型(ARMA)、支持向量机(SVM)、决策树、主成分分析(PCA)、神经网络(NN)等,并展现出了优异的预测结果。基于数据驱动的预测模型直接在数据样本上进行训练,无需过多人工干预,无需涉及过多水文专业知识背景,无需大量模拟计算来率定模型最优参数,并且直接使用其他流域的数据样本即可推广至其他流域的洪水流量预测。例如,一种在中国专利文献上公开的“河流流量的预测方法”,其公告号“CN108647807A”,包括如下步骤,1:数据预处理;2:VMD模型分解;3:VMD分解结果的分量重构;4:VMD-BP模型的集成及河流流量预测。但是上述基于数据驱动的预测模型也存在一些不足:前期基于数据驱动的预测模型基本属于浅层结构,对大量样本数据的特征提取及抽象表达能力有限,不足以学习到样本中的隐含的物理模型。基于数据驱动的预测模型对于可靠的数据仍然有较大的依赖性,数据越可靠,越具多样性,越多的数据样本,将训练得到越可靠的预测模型。
技术实现思路
本专利技术主要解决现有技术的不足;提供一种基于三维卷积神经网络的河流流量预测方法,通过探究气象、水文的不同因素之间的相关性,使得二维卷积核不受卷积核大小的局限及输入特征人为布局的影响,隐式地扩大了感受野,进而能够挖掘不同特征之间的隐含关联性,进行抽象特征提取以及表述,并通过样本数据相关性隐式学习流域水文物理模型,有效推广至各种不同流域的流量预测。本专利技术的上述技术问题主要是通过下述技术方案得以解决的:本专利技术包括以下步骤:S1:筛选与河流流量相关的特征因素来构建气象-水文-流量数据集;S2:气象-水文-流量数据集生成上万组13维特征的长短时序数据样本,并对其进行预处理,探究气象、水文因素的相关性;S3:按比例随机划分训练集和验证集;搭建深度三维卷积神经网络,并使深度三维卷积神经网络在训练集上训练;S4:跟踪预测精度并自动保存当前最好的模型参数,在划分过的验证集上测试模型参数的均方差性能指标;S5:利用预训练过的神经网络模型进行未来n个小时的当前测站河流流量预测。通过探究气象、水文的不同因素之间的相关性,使得二维卷积核不受卷积核大小的局限及输入特征人为布局的影响,隐式地扩大了感受野,进而能够挖掘不同特征之间的隐含关联性,进行抽象特征提取以及表述,并通过样本数据相关性隐式学习流域水文物理模型,有效推广至各种不同流域的流量预测。作为优选,所述的与河流流量相关的特征包括若干个测站的降雨情况、流域土壤水分蒸发量、流域平均降雨信息以及当前测站流量信息。因为河流流域水文动态过程内含复杂的物理机理,需要根据水文过程中尽可能多的状态变量来反应和推断水文模型的成因机理。根据前人所总结的水文物理模型,需观测的状态变量理应包括气象-水文-流量中的多种因素。因此,根据实际测量条件,考虑上游10个测站的降雨情况、流域土壤水分蒸发量、流域平均降雨信息以及当前测站流量信息。作为优选,所述的数据集生成的长短时序数据样本包括输入样本是输出样本;输入样本中包含过去t个小时的上游若干测站的降雨情况和土壤水分蒸发量的特征,以及过去t个小时的当前测站流量数据;输出样本中包含未来n个小时的当前测站流量数据。t为24,n为12;使得数据样本更加可靠。作为优选,所述的时序样本预处理包括离散及空缺数据的填补、异常数据的剔除、输入数据标准化处理和多输入特征相关性矩阵计算;对于空缺的降雨及土壤水分蒸发量数据,直接填零补充;对于空缺的测站流量数据,取附近4个小时的流量数据取平均,公式如下所示:其中,flowt为填补的测站流量数据;flowt-2为过去两个小时的测站流量数据;flowt-1为过去一个小时的测站流量数据;flowt+1为之后一小时的测站流量数据;flowt+2为之后两个小时的测站流量数据;异常数据的剔除,检测每个特征离过去三个小时的平均值的距离,若该特征值偏离过去三个小时的平均值过远,即超过50%误差,则以过去三个小时的平均值替代该特征值;输入数据标准化处理,对每个小时的每个特征数据标准化;标准化公式如下:其中,Xnormalized为标准化后的输入数据;Xmin为所有样本中该特征值的最小值;Xmax为所有样本中该特征值的最大值;X为原始的特征值。对于数据的预处理,使得输入数据更加具有可靠性,避免输入数据带来的误差影响。作为优选,所述的多输入特征相关性矩阵计算包括:A.将每个时间段的特征数据排成长度为m的一列向量;B.利用步骤A中得到的特征向量求取一个特征相关矩阵,矩阵中的每一个元素的计算公式如下:其中,i,j分别为本文档来自技高网
...

【技术保护点】
1.一种基于三维卷积神经网络的河流流量预测方法,其特征在于,包括以下步骤:/nS1:筛选与河流流量相关的特征因素来构建气象-水文-流量数据集;/nS2:气象-水文-流量数据集生成上万组13维特征的长短时序数据样本,并对其进行预处理,探究气象、水文因素的相关性;/nS3:按比例随机划分训练集和验证集;搭建深度三维卷积神经网络,并使深度三维卷积神经网络在训练集上训练;/nS4:跟踪预测精度并自动保存当前最好的模型参数,在划分过的验证集上测试模型参数的均方差性能指标;/nS5:利用预训练过的神经网络模型进行未来n个小时的当前测站河流流量预测。/n

【技术特征摘要】
1.一种基于三维卷积神经网络的河流流量预测方法,其特征在于,包括以下步骤:
S1:筛选与河流流量相关的特征因素来构建气象-水文-流量数据集;
S2:气象-水文-流量数据集生成上万组13维特征的长短时序数据样本,并对其进行预处理,探究气象、水文因素的相关性;
S3:按比例随机划分训练集和验证集;搭建深度三维卷积神经网络,并使深度三维卷积神经网络在训练集上训练;
S4:跟踪预测精度并自动保存当前最好的模型参数,在划分过的验证集上测试模型参数的均方差性能指标;
S5:利用预训练过的神经网络模型进行未来n个小时的当前测站河流流量预测。


2.根据权利要求1所述的一种基于三维卷积神经网络的河流流量预测方法,其特征在于,所述的与河流流量相关的特征包括若干个测站的降雨情况、流域土壤水分蒸发量、流域平均降雨信息以及当前测站流量信息。


3.根据权利要求1或2所述的一种基于三维卷积神经网络的河流流量预测方法,其特征在于,所述的数据集生成的长短时序数据样本包括输入样本是输出样本;输入样本中包含过去t个小时的上游若干测站的降雨情况和土壤水分蒸发量的特征,以及过去t个小时的当前测站流量数据;输出样本中包含未来n个小时的当前测站流量数据。


4.根据权利要求3所述的一种基于三维卷积神经网络的河流流量预测方法,其特征在于,所述的时序样本预处理包括离散及空缺数据的填补、异常数据的剔除、输入数据标准化处理和多输入特征相关性矩阵计算;
对于空缺的降雨及土壤水分蒸发量数据,直接填零补充;
对于空缺的测站流量数据,取附近4个小时的流量数据取平均,公式如下所示:



其中,flowt为填补的测站流量数据;flowt-2为过去两个小时的测站流量数据;flowt-1为过去一个小时的测站流量数据;flowt+1为之后一小时的测站流量数据;flowt+2为之后两个小时的测站流量数据;
异常数据的剔除,检测每个特征离过去三个小时的平均值的距离,若该特征值偏离过去三个小时的平均值过远,即超过50%误差,则以过去三个小时的平均值替代该特征值;
输入数据标准化处理,对每个小时的每个特征数据标准化;标准化公式如下:



其中,Xnormalized为标准化后的输入数据;Xmin为所有样本中该特征值的最小值;Xmax为所有样本中该特征值的最大值;X为原始的特征值。


5.根据权利要求4所述的一种基于三维卷积神经网络的河流流量预测方法,其特征在于,所述的多输入特征相关性矩阵计算包括:
A.将每个时间段的特征数据排成长度为m的一列向量;
B.利用步骤A中得到的特征向量求取一个特征相关矩阵,矩阵中的每一个元素的计算公式如下:



其中,i,j分别为矩阵元素的下标,mi,mj分别代表特征向量中的第i,j个特征数据;
C.得到每个时间段的特征相关矩阵后,将过去t个小时的特征相关矩阵...

【专利技术属性】
技术研发人员:张巍杨聃王汉勇邵广俊林烨敏刘国富刘文娟金建乐项敏胡伟飞苏洁
申请(专利权)人:国网浙江省电力有限公司紧水滩水力发电厂
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1