System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于水库水位预测领域,具体涉及一种基于多源数据融合集成的水库水位预测方法。
技术介绍
1、水库是指在山沟或河流的狭口处建造拦河坝形成的人工湖泊,一般修建为拦洪蓄水和调节水流的水利工程建筑物。水库通常被建设于雨水充沛、水流落差大的地区,主要用于调节和储存水资源,供应供水、灌溉、发电和防洪等。水库水位的变化影响着当地的生产生活,因此,提高水库水位的预测精度对水库的水资源调度、防洪减灾、安全管理等方面具有重大意义。
2、目前的水库水位控制技术通常依赖传感器采集水库水位信息,并结合气象预报进行调控。然而,现有方法在数据利用上存在不足,未能充分利用历史水位信息或其他与水位相关的变量之间的关系。同时,这些方法还依赖于经验,可能引入较强的主观判断。这样的做法在实践中难以达到稳定、科学和合理的水位调控,甚至可能导致资源浪费,给区域人民群众的生产带来不确定性。
技术实现思路
1、本专利技术的目的是针对现有技术的不足,提出一种基于多源数据融合集成的水库水位预测方法,可以有效地利用历史水位信息和其他相关变量之间的关系,提高水位预测的准确性和可靠性。为此,本专利技术采用以下技术方案:
2、一种基于多源数据融合集成的水库水位预测方法,包括以下步骤:
3、(1)收集数据集,包括历史水位数据、及其影响因素(蒸发量、降雨量、流量、泄洪量、温度、压力、湿度)数据,对收集到的数据进行清洗和标准化处理;
4、(2)采用xgboost特征选择算法对水位的影响因素做
5、(3)建立基于idoa-ensemble的水位预测模型,其中集成方法采用stacking集成学习法,初级学习器为bilstm、knnr、lightgbm,元学习器为relm;
6、(4)利用改进后的野狗优化算法(idoa)优化元学习器relm预测模型的超参数,所述idoa是在原doa算法基础上采用halton序列产生伪随机数来初始化种群,在捕食策略中引入了动态概率值s和j代替了原来的固定值,通过s和j的动态调整,选择更合理的捕食策略,
7、(5)将历史水位数据以及最佳特征数据输入到各初级学习器中,获得初级学习器的预测结果;根据各初级学习器自身的预测精度,为初级学习器赋予相应的权值,再代入元学习器idoa-relm进行训练,得到最终的预测结果。
8、进一步地,所述步骤(1)中,数据集中的缺失值和异常值都采用等距的均值法进行填充和替换,公式如下:
9、
10、其中,k的取值为5,ai是缺失值或需替换的异常值,ai-1是前一时刻的数据值,ai-k是前k时刻的数据值,ai+1是后一时刻数据值,ai+k是后k时刻的数据值。
11、采用最小最大标准化(min-max标准化)方法处理原始数据,公式如下:
12、
13、其中,a′代表标准化后的数据,a代表原始数据,amax表示数据集属性中的最大值,amin表示数据集属性中的最小值;
14、进一步地,所述步骤(2)中,对于经过数据预处理之后的水位数据集u={(xi,yi)}(i=0,1,…,t),其中表示输入的水位数据的n个特征值,yi表示第i个样本的标签值。将水位数据集u输入到xgboost中进行训练得到k棵树,可以表示为:
15、
16、f={f(x)=mq(x)} (4)
17、其中,表示第i个样本的预测结果,f是v棵树的集合,fv表示第v棵回归树,mq(x)表示叶子节点q的分数。
18、训练过程中的目标函数为:
19、
20、其中,l是用于计算预测值和真实值之间的误差的损失函数,ω是表示树的复杂度的函数,c1为常数,ft(xi)表示树结构值;
21、将目标函数通过二阶泰勒展开并转换成按叶节点累加的形式,表达式如下:
22、
23、
24、
25、其中,i为每个叶子节点上样本的集合,wj为每棵树叶子节点的输出分数;λ和τ为权重因,n为分裂树的叶子节点个数;di为预测误差对当前模型的一阶导数,pi为许多预测误差对当前模型的二阶导数;
26、创建好提升决策树后通过计算增益得到每个特征的特征重要性,计算选取特征的增益,表达式如下所示:
27、
28、其中,下标l、r分别表示左子树和左子树,表示左子树分数,表示右子树分数,表示当前节点不分割的分数;
29、特征被越多的提升树所选择,该特征越重要。最终将一个特征在所有提升树中的结果进行加权求和后取平均,得到重要性分数。按重要性分数从高到低排序后,通过设置不同的阈值筛选出包括历史水位、降雨量、蒸发量和流量在内的4个影响水位的最佳特征。
30、进一步地,所述步骤(3)实现过程如下:
31、双向长短期记忆网络模型(bi-lstm):
32、双向长短期记忆是传统长短期记亿(lstm)的一种拓展,在输入序列的所有时间步长可用问题中,bilstm在输入序列上训练两个lstm,双向循环神经网络在隐藏层中的信息传递有两种方式,即正向接递与反向传递相结合。在t时刻,正向传递的rn单元与反向传递的rnn单元在ban的基础上修改隐藏层神经单元为lstm单元,即得到bilstm,故前向lstm与后向lstm组合得到bilstm模型结构。
33、k-最近邻回归(knnr):
34、knnr模型属于一种非参数模型,它以距离度量为基础,找到训练集中与其最近的k个训练样本,knnr的欧式距离表达式如下所示:
35、
36、其中,d为测试样本和指定训练样本之间的欧氏距离,k为最近邻样本数量,ri为第1个点的第n维坐标,ci为第2个点的第n维坐标;
37、knnr的建模预测流程为:首先确定距离计算方法,确定k值大小,再从训练集中找到k个与测试样本距离最接近的样本,最后使用k个近邻的均值作为测试样本的预测值。
38、lightgbm模型:
39、lightgbm模型是gbdt的高效实现,本质是一种将弱学习器提升为强学习器的集成学习算法。相比于极端梯度提升树(xgboost),lightgbm模型最大的改进之一是通过单边梯度采样算法来最大限度地保留对计算信息增益有帮助的样本,加快模型的训练速度。方差增益为:
40、
41、其中:n为样本总数,j代表分裂特征,z代表样本特征的分裂点,分别为使用的分裂特征值小于和大于d的样本数,d1,1为分裂的左子节点中的大梯度样本,d1,2为分裂的左子节点中的小梯度样本,dr,1为分裂的右子节点中的大梯度样本,dr,2为分裂的右子节点中的小梯度样本,h为样本梯度,a为大梯度样本采样率,c为小梯度样本采样率。样本梯度为:
42、
...【技术保护点】
1.一种基于多源数据融合集成的水库水位预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于多源数据融合集成的水位预测方法,其特征在于,所述步骤(1)中,数据集中的缺失值和异常值都采用等距的均值法进行填充和替换,公式如下:
3.根据权利要求1所述的一种基于多源数据融合集成的水位预测方法,其特征在于,所述步骤(2)中,
4.根据权利要求1所述的一种基于多源数据融合集成的水位预测方法,其特征在于,所述步骤(3)中,
5.根据权利要求1所述的一种基于多源数据融合集成的水位预测方法,其特征在于,所述步骤(4)中,具体步骤如下:
6.根据权利要求1所述的一种基于多源数据融合集成的水位预测方法,其特征在于,所述步骤(5)中,
【技术特征摘要】
1.一种基于多源数据融合集成的水库水位预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于多源数据融合集成的水位预测方法,其特征在于,所述步骤(1)中,数据集中的缺失值和异常值都采用等距的均值法进行填充和替换,公式如下:
3.根据权利要求1所述的一种基于多源数据融合集成的水位预测方法,其特征在于,所述步骤...
【专利技术属性】
技术研发人员:李黎,魏军,寿玮玮,陈冬强,刘月馨,许雯,王雪峰,
申请(专利权)人:杭州华辰电力控制工程有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。