一种基于集成学习的神经网络水库水位预测方法技术

技术编号:35201968 阅读:17 留言:0更新日期:2022-10-15 10:10
本发明专利技术公开一种基于集成学习的神经网络水库水位预测方法,该方法包括:选取水库空间上相邻的各个水位站长期流入的水位历史数据,形成数据集;对数据集进行数值变换,即数据归一化,得到标准数据集,并对标准数据集划分为训练集、验证集和测试集;构建基于集成学习的神经网络模型,定义损失函数;选择标准数据集的数据对神经网络模型进行训练,并对训练后网络模型进行验证调参;采用Epoch

【技术实现步骤摘要】
一种基于集成学习的神经网络水库水位预测方法


[0001]本专利技术属于水库水位实时预测
,具体涉及一种基于集成学习的神经网络水库水位预测方法。

技术介绍

[0002]水库水位是维持其生态系统结构、功能和完整性的基础。正常蓄积的水位决定水库的规模,效益和调节方式,同时又决定水工建筑物的尺寸,型式和水库的淹没损失,是水库调度最重要的一项特征任务。与此同时,水位作为水库水情变化最直接和最重要的指示,在现代湖泊研究中具有重大现实意义,寻求有效的水库水位模拟方法已成为当前研究所面临的一个重要而又紧迫的任务。
[0003]一种常用的水库水位预测方法是借助水库水位监测系统中的水位变化历史数据做输入,通过提取其统计学特征(例如均值、方差、最大值和最小值等)进而预测未来某个时间段内的水位变化趋势。从目前已有的预测效果来看,由于水库空间上相邻水位站的流入影响,基于统计学方法的水位预测精度低,预测稳定度不好。近年来,随着大数据技术、机器学习算法的普及,应用人工智能方法实时预测水库水位成为研究热点。
[0004]水库水位历史数据属于时间序列数据,空间上相邻水位站的水量流入后经过水库的调蓄作用,导致水位和流量并不总是同步变化,存在明显的相位滞后效应。应用人工智能方法,比如机器学习技术和深度学习技术,能够有效挖掘水库相邻各个水位站水流和水库水位的潜在时间关系,进而实现高精度实时预测未来某一时刻的水库水位情况。

技术实现思路

[0005]专利技术目的:根据上述提出的技术问题,而提供的一种基于集成学习的神经网络水库水位预测方法。本专利技术基于水库空间上相邻各个水位站采集到的水位历史数据,构建基于卷积神经网络和长短期时间记忆网络的神经网络水库水位预测模型,并使用Epoch

Wise Bagging集成学习策略优化模型精度。一方面,使用二维卷积神经网络捕捉空间上不同位置水位站之间水位值的某种关联,从而提高模型的信息提取能力;另一方面,使用长短期时间记忆网络学习水库水位的时间依赖关系和变化趋势,从而提高模型水位预测的精度。
[0006]技术方案:为了解决上述技术问题,本专利技术提出了一种基于集成学习的神经网络水库水位预测方法,该方法包括以下步骤:
[0007]步骤1:收集水库空间上相邻的各个水位站预设时间段内流入的水位历史数据以形成水库水位样本数据;
[0008]步骤2:对步骤1中的水库水位样本数据进行数值变换,即数据归一化,以此得到标准数据集,并对标准数据集划分为训练集、验证集和测试集;
[0009]步骤3:构建基于卷积神经网络和长短期时间记忆网络混合模型,定义模型损失函数;
[0010]步骤4:使用步骤2中的训练集训练步骤3中构建的神经网络模型,并使用梯度下降
策略对步骤3的损失函数进行优化;
[0011]步骤5:使用步骤2中的验证集对神经网络模型进行调参,通过多次验证从而确定模型的网络权重参数,并保存验证过程中预测精度最高的M个最优模型;
[0012]步骤6:根据Epoch

Wise Bagging集成学习策略,选择步骤5中经过验证集验证后的M个最优网络模型,使用步骤2中的测试集对这M个最优网络模型进行测试;
[0013]步骤7:将各个水位站的实时来水量组合输入到M个最优网络模型中,将这M个最优网络模型对应的M个输出结果以加权求平均的方法计算得到最终的模型输出以预测水库未来1天以内的实时水位空间分布。
[0014]进一步的,步骤1中,所述对水位历史数据进行收集并形成用于预测水库水位的输入样本数据集,其形状表示为[N,t,k],其中,N代表水库水位的输入数据总样本量,k代表水库空间上的相邻水位站的个数,以每天为最小为单位,t表示每个水位站在连续t天的水位值。
[0015]进一步的,步骤2中的数据归一化为:
[0016][0017]其中,X
cur
分别是t和k当前需要被归一化的数值;X
min
分别是t和k的最小值;X
max
分别是t和k的最大值;
[0018]将经过归一化后的输入数据样本按照8:1:1的比例划分为训练集、验证集和测试集。
[0019]进一步的,步骤3中,所述卷积神经网络和长短期时间记忆混合模型具体包括以下几层,依次为:输入层、3个二维卷积层、第一层LSTM层、第二层LSTM层、输出层;
[0020]输入层的数据为[N,t,k],其中,N代表水库水位数据样本量,k代表水库空间上的相邻水位站的个数,以每天为最小为单位,t表示每个水位站在连续t天内的水位值;二维卷积层共三层,分别表示为C1、C2、C3,其中卷积层表示为:C=f(wx+b),其中,f为激活函数,三层均为ReLU激活函数,为了匹配二维卷积操作,将输入层扩展一个维度,扩展后的输入形状为[N,t,k,1],通过设置卷积核的尺寸及padding操作,进一步得到经过三层二维卷积层后的输出,其输出维度为[N,m,k,256],其中,m表示经过三层卷积后的数值,其包括t天内的水位时间变化规律;输出通道数为256,其综合了k个水位站之间的水位变化数据;
[0021]将上述经过三层卷积后的输出维度进行合并,得到输出形状为[N,m*k*256]以匹配第一个LSTM层的输入,经过第一层LSTM的输出形状为[N,256],其中,中间隐藏层的神经元数量为256,最后将输出送入第二层LSTM并得到形状为[N,512]的输出,其中输出神经元的数量为512;
[0022]输出层为全连接层,接收来自第二层LSTM的输出作为其输入,并得到形状为[N,5]的输出,其中,5表示为未来一天内5个下游水位站的日平均水位数据;
[0023]所述损失函数为:
[0024][0025]其中,Y
obs
为实际水库水位值,Y
pre
为上述神经网络模型的预测值,N表示总样本数。
[0026]进一步的,步骤4和步骤5中,网络训练过程中采用基于梯度下降策略的Adam优化器对权重参数进行优化,批处理参数batch_size设置为200,训练轮数设置为100,学习率设置为0.0001,使用Dropout正则化方法以降低网络过拟合;基于训练集搭建好网络模型后,进在验证集上调节网络的超参数,通过多次验证从而确定模型的网络权重参数,并保存验证过程中预测精度最高的M个最优模型。
[0027]进一步的,步骤6中,所述Epoch

Wise Bagging集成学习策略包括:基于训练集搭建卷积神经网络和长短期时间记忆混合模型,通过验证集调节网络的权重参数并保存M个最优精度模型作为基学习器,然后选择这M个最优基学习器进行集成学习测试进而输出M个最优基学习器的预测结果。
[0028]本专利技术人提出一种基于集成学习的神经网络水库水位预测系统,该系统包括以下步骤:
[0029]数据收集模块:收集水库空间上相邻的各个水位站预设时间段内流入的水位历史数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于集成学习的神经网络水库水位预测方法,其特征在于,包括以下步骤:步骤1:收集水库空间上相邻的各个水位站预设时间段内流入的水位历史数据以形成水库水位样本数据;步骤2:对步骤1中的水库水位样本数据进行数值变换,即数据归一化,以此得到标准数据集,并对标准数据集划分为训练集、验证集和测试集;步骤3:构建基于卷积神经网络和长短期时间记忆网络混合模型,定义模型损失函数;步骤4:使用步骤2中的训练集训练步骤3中构建的神经网络模型,并使用梯度下降策略对步骤3的损失函数进行优化;步骤5:使用步骤2中的验证集对神经网络模型进行调参,通过多次验证从而确定模型的网络权重参数,并保存验证过程中预测精度最高的M个最优模型;步骤6:根据Epoch

Wise Bagging集成学习策略,选择步骤5中经过验证集验证后的M个最优网络模型,使用步骤2中的测试集对这M个最优网络模型进行测试;步骤7:将各个水位站的实时来水量组合输入到M个最优网络模型中,将这M个最优网络模型对应的M个输出结果以加权求平均的方法计算得到最终的模型输出以预测水库未来1天以内的实时水位空间分布。2.根据权利要求1所述的一种基于集成学习的神经网络水库水位预测方法,其特征在于,步骤1中,所述对水位历史数据进行收集并形成用于预测水库水位的输入样本数据集,其形状表示为[N,t,k],其中,N代表水库水位的输入数据总样本量,k代表水库空间上的相邻水位站的个数,以每天为最小为单位,t表示每个水位站在连续t天的水位值。3.根据权利要求1所述的一种基于集成学习的神经网络水库水位预测方法,其特征在于,步骤2中的数据归一化为:其中,X
cur
分别是t和k当前需要被归一化的数值;X
min
分别是t和k的最小值;X
max
分别是t和k的最大值;将经过归一化后的输入数据样本按照8:1:1的比例划分为训练集、验证集和测试集。4.根据权利要求1所述的一种基于集成学习的神经网络水库水位预测方法,其特征在于,步骤3中,所述卷积神经网络和长短期时间记忆混合模型具体包括以下几层,依次为:输入层、3个二维卷积层、第一层LSTM层、第二层LSTM层、输出层;输入层的数据为[N,t,k],其中,N代表水库水位数据样本量,k代表水库空间上的相邻水位站的个数,以每天为最小为单位,t表示每个水位站在连续t天内的水位值;二维卷积层共三层,分别表示为C1、C2、C3,其中卷积层表示为:C=f(wx+b),其中,f为激活函数,三层均为ReLU激活函数,为了匹配二维卷积操作,将输入层扩展一个维度,扩展后的输入形状为[N,t,k,1],通过设置卷积核的尺寸及padding操作,进一步得到经过三层二维卷积层后的输出,其输出维度为[N,m,k,256],其中,m表示经过三层卷积后的数值,其包括t天内的水位时间变化规律;输出通道数为256,其综合了k个水位站之间的水位变化数据;将上述经过三层卷积后的输出维度进行合并,得到输出形状为[N,m*k*256]以匹配第一个LSTM层的输入,经过第一层LSTM的输出形状为[N,256],其中,中间隐藏层的神经元数量为256,最后将输出送入第二层LSTM并得到形状为[N,512]的输出,其中输出神经元的数
量为512;输出层为全连接层,接收来自第二层LSTM的输出作为其输入,并得到形状为[N,5]的输出,其中,5表示为未来一天内5个下游水位站的日平均水位数据;所述损失函数为:其中,Y
obs
为实际水库水位值,Y
pre
为上述神经网络模型的预测值,N表示总样本数。5.根据权利要求4所述的一种基于集成学习的神经网络水库水位预测方法,其特征在于,步骤4和步骤5中,网络训练过程中采用基于梯度下降策略的Adam优化器对权重参数进行优化,批处理参数batch_size设置为200,训练轮数设置为100,学习率设置为0.0001,使用Dropout正则化方法以降低网络过拟合;基于训练集搭建好网络模型后,进在验证集上调节网络的超参数,通过多次验证从而确定模型的网络权重参数,并保存验证过程中预测精度最高...

【专利技术属性】
技术研发人员:方骏殷召生徐培辉高阳李晓轩秦民曹新
申请(专利权)人:国家能源集团西藏尼洋河流域水电开发有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1