基于集成学习算法的水文模型实时校正方法和系统技术方案

技术编号:38546705 阅读:13 留言:0更新日期:2023-08-22 20:55
本发明专利技术公开了一种基于集成学习算法的水文模型实时校正方法和系统,方法包括如下步骤:采集研究区域信息并获取流域类型和水文特征,构建耦合洪水预报模型;针对耦合洪水预报模型,筛选校正方法并分类,获得至少两类校正方法,采用每个校正方法对水文模型进行校正,获得预测流量序列;构建随机森林集成学习模型并训练;构建评价指标集合,对所述随机森林集成学习模型的预报效果进行评价,若达到预设评价值,输出基于集成学习算法的水文模型;采用所述基于集成学习算法的水文模型进行洪水预测,获得实时校正的水文序列预测结果。本申请提供了一种通用性强、计算效率高且准确高的水文模型校正方法,具有很好的社会经济价值。具有很好的社会经济价值。具有很好的社会经济价值。

【技术实现步骤摘要】
基于集成学习算法的水文模型实时校正方法和系统


[0001]本专利技术涉及水文仿真预报技术,尤其是一种基于集成学习算法的水文模型实时校正方法和系统。

技术介绍

[0002]洪水预报是防灾减灾非工程措施的核心技术之一。然而,由于自然环境的复杂性和人类认识的局限性,洪水预报不可避免地存在误差,给实时洪水作业预报带来精度瓶颈。因此,实时校正成为降低预报误差、提升预报精度的最后一道屏障。实时校正是指在洪水发生期间,利用实时观测数据和预测数据,对洪水预报结果进行修正和更新的过程。实时校正可以分为两类:终端误差校正和过程误差校正。终端误差校正是指不考虑洪水预报中间过程误差的各种影响因素,直接对最终的预报误差(终端误差)进行校正。过程误差校正是指对水文预报各个过程(如降雨、产流、汇流等)或预报模型的状态变量进行校正,通过降低预报各环节的误差以达到降低终端误差的目的。
[0003]单一的预报方法目前还存在一些缺点:终端误差校正方法不考虑洪水预报中间过程误差的各种影响因素,只对最终的预报误差进行校正,物理基础不强,且损失预见期。例如,AR方法假设预报误差具有前后相依联系,根据历史预报误差序列发现规律,用以对未来误差进行预测,从而实现原预报结果的修正。但这种方法忽略了预报误差的来源和性质,只是一种统计拟合,不能反映水文过程的物理机制,且随着预见期的增加,校正效果会逐渐下降。过程误差校正方法需要对水文预报各个过程或预报模型的状态变量进行校正,但这些过程或状态变量往往难以获取或估计,且校正效果不理想。例如,KF方法借助状态方程和量测方程来描绘洪水的整个线性动态过程,进而对洪水过程进行校正。但这种方法需要准确估计系统模型和噪声,由于洪水过程的复杂性,描述水文系统的模型及噪声的分布函数都是近似的,致使KF方法在实时洪水作业预报中受到一定的限制。
[0004]总之,单一实时校正方法往往只能在某些指标上具有较好的准确性,但无法集中所有的优势,且学习器之间可能存在相关性或干扰。例如,FST方法基于洪水预报误差的相似性,利用系统所能得到的各种有效信息进行洪水预报误差实时校正。但这种方法依赖于预报序列的趋势是否准确,当预报序列不能准确把握未来流量涨跌趋势时,校正序列也难以达到对未来流量的准确预测。此外,在进行洪水预报和误差校正交替滚动的过程中,预报误差会不断累积。
[0005]因此,需要进行技术创新,以期解决相关问题。

技术实现思路

[0006]专利技术目的:一方面,提供一种基于集成学习算法的水文模型实时校正方法,以解决现有技术存在的上述问题。另一方面,提供一种基于集成学习算法的水文模型实时校正系统。
[0007]技术方案:根据本申请的一个方面,提供一种基于集成学习算法的水文模型实时
校正方法,包括如下步骤:步骤S1、采集研究区域信息并获取流域类型和水文特征;结合流域类型和水文特征,筛选至少两个水文模型,并构建水文模型集合;选择水文模型集合中的水文模型,构建耦合洪水预报模型;步骤S2、针对耦合洪水预报模型,筛选校正方法并分类,获得至少两类校正方法,每类校正方法包括至少一个校正方法,对不同类别的校正方法进行解耦处理,从每类校正方法中筛选一个校正方法,组成校正方法集;确定耦合洪水预报模型的输入数据和输出数据,采集输入数据并预处理,分别采用每个校正方法对水文模型进行校正,获得预测流量序列;步骤S3、基于Bagging集成学习算法构建随机森林集成学习模型,以每个校正方法的预测流量序列和实测流量序列作为训练集对随机森林集成学习模型进行训练;构建评价指标集合,对所述随机森林集成学习模型的预报效果进行评价,若达到预设评价值,输出基于集成学习算法的水文模型;步骤S4、采用所述基于集成学习算法的水文模型进行洪水预测,获得实时校正的水文序列预测结果。
[0008]根据本申请的一个方面,所述步骤S1进一步为:步骤S11、采集研究区域信息,所述研究区域信息包括地理、地形、气候和植被,从研究区域信息中获取流域类型和水文特征,根据流域类型和水文特征将研究区域划分为N个子区域,获取每个子流域的流域类型和水文特征;N为自然数;所述流域类型至少包括平原流域和山区流域;所述水文特征包括流量、水位、含沙量、汛期、冰期、水能、航运价值和工农业价值;步骤S12、基于研究目标和要求,结合流域特征和水文特征,从预存储的水文模型库中筛选至少两个水文模型,构建水文模型集合;所述水文模型库中存储有水文模型的标签信息,所述标签信息包括模型基础、研究尺度和模拟目标;所述模型基础至少包括理论模型和经验模型,所述研究尺度至少包括时间尺度、空间尺度和竖向尺度,所述模拟目标至少包括水平衡和水动力;步骤S13、针对每一子流域,从水文模型中选取对应的不同模型基础的水文模型,构建耦合洪水预报模型。
[0009]根据本申请的一个方面,所述步骤S2进一步为:步骤S21、构建校正方法集合并根据校正方法的作用对象和原理将其分成至少四类,包括针对输入变量的校正方法、针对状态变量的校正方法、针对模型参数的校正方法和针对预报结果的校正方法;每类校正方法至少包括一个校正方法;步骤S22、对不同类别的校正方法进行解耦处理,并为校正方法设置耦合标签,包括:确定每个校正方法的作用对象和作用时机,确定不同类型的校正方法与水文模型的接口和传递方式,评价校正方法对模型性能和预报精度的改善或损失,并如何调整校正方法的参数或算法以优化结果;步骤S23、从每类校正方法中筛选一个校正方法,组成解耦的校正方法集;确定耦合洪水预报模型的输入数据和输出数据,采集输入数据并预处理,分别采用每个校正方法对模型进行校正,获得预测流量序列。
[0010]根据本申请的一个方面,步骤S11中根据流域类型和水文特征将研究区域划分为N个子区域的过程具体包括:步骤S11a、获取研究区域的数字高程模型,采用GIS模块将研究区域栅格化并对子流域进行划分;步骤S11b、去除洼地和噪声,并确定水流在每个栅格内的流向,集散每个栅格的汇流积累量并河网等级和阈值提取河网;步骤S11c、根据河网确定流域出水口并划分子流域,计算每个子流域的基本参数,建立各个子流域之间的拓扑关系和数据关系。
[0011]根据本申请的一个方面,所述步骤S3进一步为:步骤S31、基于Bagging集成学习算法构建随机森林集成学习模型,获取M个校正方法的预测流量序列和实测流量序列,并构建数据集,形成M个数据集;所述M为自然数;步骤S32、对于每个数据集,用自助抽样的方法从中抽取K个样本作为随机森林的训练集,获得M个训练集,K为小于M的自然数;步骤S33、对于每个训练集,基于决策树构建随机森林;针对每个随机森林模型,使其采用原始数据集进行预测,获得预测结果和实测结果之间的误差;步骤S34、构建评价指标集合,并对每个随机森林模型进行评价,比较不同随机森林模型的评价指标,并从达到预设评价值的方案中选择最优的模型作为基于集成学习算法的水文模型。
[0012]根据本申请的一个方面,所述耦合洪水预报模型为XAJ3~CNN~LSTM模型;所述校正方法包括反馈模拟方法、Kalman滤波本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于集成学习算法的水文模型实时校正方法,其特征在于,包括如下步骤:步骤S1、采集研究区域信息并获取流域类型和水文特征;结合流域类型和水文特征,筛选至少两个水文模型,并构建水文模型集合;选择水文模型集合中的水文模型,构建耦合洪水预报模型;步骤S2、针对耦合洪水预报模型,筛选校正方法并分类,获得至少两类校正方法,每类校正方法包括至少一个校正方法,对不同类别的校正方法进行解耦处理,从每类校正方法中筛选一个校正方法,组成校正方法集;确定耦合洪水预报模型的输入数据和输出数据,采集输入数据并预处理,分别采用每个校正方法对水文模型进行校正,获得预测流量序列;步骤S3、基于Bagging集成学习算法构建随机森林集成学习模型,以每个校正方法的预测流量序列和实测流量序列作为训练集对随机森林集成学习模型进行训练;构建评价指标集合,对所述随机森林集成学习模型的预报效果进行评价,若达到预设评价值,输出基于集成学习算法的水文模型;步骤S4、采用所述基于集成学习算法的水文模型进行洪水预测,获得实时校正的水文序列预测结果。2.如权利要求1所述的基于集成学习算法的水文模型实时校正方法,其特征在于,所述步骤S1进一步为:步骤S11、采集研究区域信息,所述研究区域信息包括地理、地形、气候和植被,从研究区域信息中获取流域类型和水文特征,根据流域类型和水文特征将研究区域划分为N个子区域,获取每个子流域的流域类型和水文特征;N为自然数;所述流域类型至少包括平原流域和山区流域;所述水文特征包括流量、水位、含沙量、汛期、冰期、水能、航运价值和工农业价值;步骤S12、基于研究目标和要求,结合流域特征和水文特征,从预存储的水文模型库中筛选至少两个水文模型,构建水文模型集合;所述水文模型库中存储有水文模型的标签信息,所述标签信息包括模型基础、研究尺度和模拟目标;所述模型基础至少包括理论模型和经验模型,所述研究尺度至少包括时间尺度、空间尺度和竖向尺度,所述模拟目标至少包括水平衡和水动力;步骤S13、针对每一子流域,从水文模型中选取对应的不同模型基础的水文模型,构建耦合洪水预报模型。3.如权利要求2所述的基于集成学习算法的水文模型实时校正方法,其特征在于,所述步骤S2进一步为:步骤S21、构建校正方法集合并根据校正方法的作用对象和原理将其分成至少四类,包括针对输入变量的校正方法、针对状态变量的校正方法、针对模型参数的校正方法和针对预报结果的校正方法;每类校正方法至少包括一个校正方法;步骤S22、对不同类别的校正方法进行解耦处理,并为校正方法设置耦合标签,包括:确定每个校正方法的作用对象和作用时机,确定不同类型的校正方法与水文模型的接口和传递方式,评价校正方法对模型性能和预报精度的改善或损失,并如何调整校正方法的参数或算法以优化结果;步骤S23、从每类校正方法中筛选一个校正方法,组成解耦的校正方法集;确定耦合洪水预报模型的输入数据和输出数据,采集输入数据并预处理,分别采用每个校正方法对模
型进行校正,获得预测流量序列。4.如权利要求2或3所述的基于集成学习算法的水文模型实时校正方法,其特征在于,步骤S11中根据流域类型和水文特征将研究区域划分为N个子区域的过程具体包括:步骤S11a、获取研究区域的数字...

【专利技术属性】
技术研发人员:王欣怡张野王磊之刘锦霞牛凯杰李伶杰苏鑫李曦亭刘勇崔婷婷商守卫谢松
申请(专利权)人:水利部交通运输部国家能源局南京水利科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1