一种基于生成对抗网络的流域多点水位预测预警方法技术

技术编号:36553896 阅读:12 留言:0更新日期:2023-02-04 17:08
本发明专利技术涉及一种基于生成对抗网络的流域多点水位预测预警方法,包括:1、获取历史窗口内的流域水位数据作为模型的输入数据;对数据进行预处理,再利用时间序列分解方法构造特征工程,扩展模型可利用的特征数据,然后对数据进行归一化处理,并利用滑动窗口将数据处理成符合模型输入的格式,而后构成数据集并划分为训练集和测试集;2、构建生成器和鉴别器,在真实数据上训练鉴别器,在生成器输出的预测数据上训练鉴别器,形成基于生成对抗网络的水位预测模型;通过粒子群优化算法对模型参数进行优化,得到最优的水位预测模型;3、调用优化后的水位预测模型进行流域水位预测,得到流域水位预测值。该方法有利于提高流域多点水位预测的准确性。准确性。

【技术实现步骤摘要】
一种基于生成对抗网络的流域多点水位预测预警方法


[0001]本专利技术属于流域水位预测
,具体涉及一种基于生成对抗网络的流域多点水位预测预警方法。

技术介绍

[0002]河流流域水位预测是各地预防洪涝灾害的必要举措,提升流域水位预测精度能够推进河流流域的水利设施建设,尤其对环境承载能力较低的地区具有更加重要的意义。多数河流干道或支流受到各类工程的影响导致流域水位非线性变化加剧,传统的机器学习方法无法较好的拟合非线性、非平稳的时间序列曲线。传统机器学习方式具有一定的延迟性,且对于数据的利用比较片面,忽略了采集的流域多点各项指标,导致耗费巨大资源与采集到的多下游多流域点的数据搁置,同时还需投入资源维护流域环境。在流域多点水位调整过程中,仅能进行实时规整,不能依据流域多点未来水位的变化趋势进行流域多点水位调整,无法针对性地预测出要超过警戒的水位值及其地理位置,从而实现对汛期及其他自然灾害的预防。
[0003]流域水位预测模型,围绕着流域水域中多个监测点的水位预测工作进行,传统方法针对流域水位控制只能通过固定的实践经验与数学公式结合实时降雨量与泄洪量水位值来调整源头水库的水量来规整流域水位,只能做到实时规整,无法充分利用源头水库未来降雨和泄洪的数据来根据流域多监测点未来水位的变化趋势进行流域多点水位调整,因此,该技术方案具有以下三个缺点:
[0004]1、数学公式的计算方式较为固定。传统的流域多点水位规整方法根据实时采集的源头水库与流域水位数据直接套公式获得对源头水库泄洪量的反馈,会有延时性的缺陷,无法对流域水位未来一天或几天的水位进行预测。
[0005]2、传统方法很难进行流域多点预测,受单变量预测输出的限制。很大程度上对实践经验具有依赖性,流域水位在自然灾害发生时升高具有一定的突发性与不可预测性,缺乏客观有效的未来水位预测。
[0006]3、对于采集的源头水库与流域水位数据利用率较低,造成数据资源浪费,传统方法无法利用未来降雨量和未来泄洪量的数据,前者可以通过天气预报获得较为精准的估计,后者则是人为可控制的。

技术实现思路

[0007]本专利技术的目的在于提供一种基于生成对抗网络的流域多点水位预测预警方法,该方法有利于提高流域多点水位预测的准确性。
[0008]为实现上述目的,本专利技术采用的技术方案是:一种基于生成对抗网络的流域多点水位预测预警方法,包括以下步骤:
[0009]步骤1、获取历史窗口内的流域水位数据作为模型的输入数据;对数据进行预处理,再利用时间序列分解方法构造特征工程,扩展模型可利用的特征数据,然后对数据进行
归一化处理,并利用滑动窗口将数据处理成符合模型输入的格式,而后构成数据集并划分为训练集和测试集;
[0010]步骤2、构建生成器和鉴别器,在真实数据上训练鉴别器,在生成器输出的预测数据上训练鉴别器,形成基于生成对抗网络的水位预测模型;通过粒子群优化算法对模型参数进行优化,得到最优的水位预测模型;
[0011]步骤3、调用优化后的水位预测模型进行流域水位预测,得到流域水位预测值。
[0012]进一步地,步骤1中,获取的流域水位数据包括流域源头水库的降雨量、泄洪量数据和流域多个监测点水位数据。
[0013]进一步地,步骤1中,对数据进行预处理的具体方法为:将数据按采集时间进行排序;删除数据中的无用特征;对于存在缺失值的数据,采用缺失值的前一个值对缺失值进行填补。
[0014]进一步地,步骤1中,利用时间序列分解方法构造特征工程的具体方法为:
[0015]利用时间序列分解方法将时序序列分解为三部分:季节项、趋势项、残差项(residue);当要估计某个响应变量值时,先从其预测变量附近取一个数据子集,然后对该子集进行线性回归或二次回归,回归时采用加权最小二乘法,即越靠近估计点的值其权重越大,最后利用得到的局部回归模型来估计响应变量的值;用这种方法进行逐点运算得到整条拟合曲线;再通过皮尔逊相关系数方法进行流域上下游水位与上下游季节项、上下游趋势项、上下游残差项的相关性分析,将分解后的趋势项与季节项当作特征加入到数据集中;设上下游水位分别为:
[0016]W
u
(w
u1
,w
u2
,

,w
un
),W
d
(w
d1
,w
d2
,

,w
dn
)
ꢀꢀ
(1)
[0017]设上游季节项、上游趋势项、上游残差项、下游季节项、下游趋势项、下游残差项分别为:
[0018]S
un
(s
u1
,s
u2
,

,s
un
),T
un
(t
u1
,t
u2
,

,t
un
),R
un
(r
u1
,r
u2
,

,r
un
)
ꢀꢀ
(2)
[0019]S
dn
(s
d1
,s
d2
,

,s
dn
),T
dn
(t
d1
,t
d2
,

,t
dn
),R
dn
(r
d1
,r
d2
,

,r
dn
)
ꢀꢀ
(3)
[0020]皮尔逊相关系数ρ等于两个变量的协方差除于两个变量的标准差,其函数表达式如下:
[0021][0022]式中,ρ表示皮尔逊相关系数,X、Y表示数据组,D(X)、D(Y)分别表示X、Y数据组的方差,x
i
、y
i
为数据组中的元素,为数据组的均值;通过采用皮尔逊相关系数方法来检验水位影响因子与水位的相关性,并根据皮尔逊相关系数矩阵来选择影响水位的关键影响因子,作为模型的输入特征。
[0023]进一步地,步骤1中,对数据进行归一化处理的具体方法为:
[0024]对数据集中每个特征变量数据依次进行最大最小值归一化处理排序后,该数据集为一组值在0到1之间的时间序列,其采集时间设为T
i
其中(i=0,1,2,

,N);最大最小值归一化预处理:
[0025][0026]在公式(5)中,X为待归一化数据,Xmin和Xmax分别表示待归一化数据中的最大值和最小值,最终将数据映射到0和1之间后,作为特征数据输入模型进行训练;
[0027]输入数据执行的任务如下:以当天源头水库泄洪量和降雨量、流域多点K个监测点水位作为一个时间点的特征,通过过去N天的特征预本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于生成对抗网络的流域多点水位预测预警方法,其特征在于,包括以下步骤:步骤1、获取历史窗口内的流域水位数据作为模型的输入数据;对数据进行预处理,再利用时间序列分解方法构造特征工程,扩展模型可利用的特征数据,然后对数据进行归一化处理,并利用滑动窗口将数据处理成符合模型输入的格式,而后构成数据集并划分为训练集和测试集;步骤2、构建生成器和鉴别器,在真实数据上训练鉴别器,在生成器输出的预测数据上训练鉴别器,形成基于生成对抗网络的水位预测模型;通过粒子群优化算法对模型参数进行优化,得到最优的水位预测模型;步骤3、调用优化后的水位预测模型进行流域水位预测,得到流域水位预测值。2.根据权利要求1所述的一种基于生成对抗网络的流域多点水位预测预警方法,其特征在于,步骤1中,获取的流域水位数据包括流域源头水库的降雨量、泄洪量数据和流域多个监测点水位数据。3.根据权利要求1所述的一种基于生成对抗网络的流域多点水位预测预警方法,其特征在于,步骤1中,对数据进行预处理的具体方法为:将数据按采集时间进行排序;删除数据中的无用特征;对于存在缺失值的数据,采用缺失值的前一个值对缺失值进行填补。4.根据权利要求1所述的一种基于生成对抗网络的流域多点水位预测预警方法,其特征在于,步骤1中,利用时间序列分解方法构造特征工程的具体方法为:利用时间序列分解方法将时序序列分解为三部分:季节项、趋势项、残差项(residue);当要估计某个响应变量值时,先从其预测变量附近取一个数据子集,然后对该子集进行线性回归或二次回归,回归时采用加权最小二乘法,即越靠近估计点的值其权重越大,最后利用得到的局部回归模型来估计响应变量的值;用这种方法进行逐点运算得到整条拟合曲线;再通过皮尔逊相关系数方法进行流域上下游水位与上下游季节项、上下游趋势项、上下游残差项的相关性分析,将分解后的趋势项与季节项当作特征加入到数据集中;设上下游水位分别为:W
u
(w
u1
,w
u2
,

,w
un
),W
d
(w
d1
,w
d2
,

,w
dn
) (1)设上游季节项、上游趋势项、上游残差项、下游季节项、下游趋势项、下游残差项分别为:S
un
(s
u1
,s
u2
,

,s
un
),T
un
(t
u1
,t
u2
,

,t
un
),R
un
(r
u1
,r
u2
,

,r
un
)(2)S
dn
(s
d1
,s
d2
,

,s
dn
),T
dn
(t
d1
,t
d2
,

,t
dn
),R
dn
(r
d1
,r
d2
,

,r
dn
)(3)皮尔逊相关系数ρ等于两个变量的协方差除于两个变量的标准差,其函数表达式如下:式中,ρ表示皮尔逊相关系数,X、Y表示数据组,D(X)、D(Y)分别表示X、Y数据组的方差,x
i
、y
i
为数据组中的元素,为数据组的均值;通过采用皮尔逊相关系数方法来检验水位影响因子与水位的相关性,并根据皮尔逊相关系数矩阵来选择影响水位的关键影响因子,作为模型的输入特征。5.根据权利要求1所述的一种基于生成对抗网络的流域多点水位预测预警方法,其特
征在于,步骤1中,对数据进行归一化处理的具体方法为:对数据集中每个特征变量数据依次进行最大最小值归一化处理排序后,该数据集为一组值在0到1之间的时间序列,其采集时间设为T
i
其中(i=0,1,2,

,N);最大最小值归一化预处理:在公式(5)中,X为待归一化数据,X min和X max分别表示待归一化数据中的最大值和最小值,最终将数据映射到0和1之间后,作为特征数据输入模型进行训练;输入数据执行的任务如下:以当天源头水库泄洪量和降雨量、流域多点K个监测点水位作为一个时间点的特征,通过过去N天的特征预测未来一天中K个监测点的水位;将数据处理成符合模型输入格式:多个监测点的特征被分别处理为F*D形状的矩阵,其中F为特征维度,D为总天数;随后使用一个大小为N的输入滑动窗口,在时间流逝方向进行滑动,滑动步长为1,N即为过去天数,每滑动一个步长形成新的样本特征,作为模型的输入;使用一个大小为1的标签滑动窗口在时间流逝方向进行滑动,每滑动一个步长形成新的样本标签,标签值为一天监测点特征的水位值;再以一定比例将数据集分割为训练集和测试集。6.根据权利要求1所述的一种基于生成对抗网络的流域多点水位预测预警方法,其特征在于,步骤2中,构建生成器和鉴别器的具体方法为:模型输入数据通过生成器编码器、鉴别器编码器两个主要模块提取特征;设x
t
为包含该时刻水位信息的特征向量,利用一个给定的历史水位数据窗口c={x0,..,x
t
},即ρ(x
t+1
|c),提前一步预测x
t+1
向量的概率分布,根据回溯窗口时间段的时序水位信息来预测下一时刻x
t+1
向量内包含的水位信息;利用条件生成对抗网络来建模ρ(x
t+1
|c);生成器与鉴别器均采用包含循环神经网络、长短期记忆网络和门控循环单元的可选模块;将注意力机制嵌入生成器与鉴别器,以学习并确定重点关注的特征;将回溯窗口内的历史水位数据作为条件提供给生成器和鉴别器;其中,生成器从均值为0和标准差为1的高斯分布中采样取得噪声向量,对条件窗口c预测下一时刻的水位信息特征向量;鉴别器取到预测值x
t+1predicted
向量,并检查它是否是一个遵循c的有效值;在此之前,模型还提取回溯窗口下一时刻的真实数据作为标签x
t+1real
对鉴别器进行训练以提升鉴别器对标签x
t+1real
和预测值x
t+1predicted
的区分能力;ForGAN值函数为:构建生成器的过程为:数据预处理:使用正态分布构建一个与原来训练标签数据大小相同的噪声矩阵,维度为[B,F],作为假的标签数据,与真实训练特征数据放入生成器中;对特征数据进行归一化;LSTM/GRU/RNN可选模块将维度调整为[L,B,F]的大小,以输入LSTM/GRU/RNN可选模块获得[L,B,E]的输出,其中E为生成器可选模块的隐藏层维度,取出最后一个位置的数据,并改变维度为[B,1,E];注意力机制把LSTM的结果送入attention中;然后取出最后时刻的数据,放入attention中,获得[B,E]的结果,并与噪声数据进行拼接,获得[B,E+F]的维度;后处理:将attention输出的数据经过线性层,ReLU函数激活,并通过线性层转换为输出维度,进行
输出;乘上对应的方差,加上均值后,获得生成器的输出;全连接层计算公式如下:在公式(7)中,D
j
为第j个输出,f(x)为激活函数,W
ji
为第j个输出的第i个输入权值参数,ε
j
为第j个输出的偏置参数,n为输入的总数;构建鉴别器的过程为:数据预处理:输入的目标数据的数据维度为[B,F],输入的特征数据的数据维度为[B,L,F],对目标数据进行维度扩展,并两者拼接,得到[B,L+1,F]的数据,使用之前计算的均值和方差进行归...

【专利技术属性】
技术研发人员:马森标李佐勇黄祖海陈友武王小川卢维楷陈惠祥
申请(专利权)人:福建中锐网络股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1