当前位置: 首页 > 专利查询>河海大学专利>正文

一种基于深度强化学习的水文预报模型参数率定方法技术

技术编号:29674791 阅读:31 留言:0更新日期:2021-08-13 21:56
本发明专利技术公开了一种基于深度强化学习的水文预报模型参数率定方法,包括:根据流域特性选取合适的水文预报模型,确定模型率定的参数及参数取值范围;建立水文预报模型参数率定的强化学习模型,确定强化学习三要素即状态空间、动作空间及奖励函数;应用深度强化学习方法DQN,优化水文预报模型的率定参数。本发明专利技术可通过设置深度强化学习模型动作值的步幅,自由控制率定参数最终优化的精确度,并采用DQN算法在率定参数的整个空间进行搜索,以确保率定参数优化的最优性,从而避免现代智能算法早熟、易陷入局部最优解的问题。

【技术实现步骤摘要】
一种基于深度强化学习的水文预报模型参数率定方法
本专利技术属于水文预报模型参数率定
,具体涉及一种基于深度强化学习的水文预报模型参数率定方法。
技术介绍
水文预报模型广泛应用于降雨模拟预报、洪水预报预警、水文过程分析等领域,对提高水文领域研究效率有着重要的作用。由于水文预报模型结构一般比较复杂,在建立了模型之后,确定模型参数就成为了亟待解决的核心问题。参数率定,是在水文预报模型中找到一组最优参数解,使模拟预报后的结果与实测数据尽可能地接近。对于水文预报模型来说,参数率定直接影响着预报的准确性,因此,研究如何提高参数率定的速度和准确度,具有重要的科研意义和应用价值。早期的水文预报模型的参数率定方法,多采用传统的人工试错法、梯度下降法等,这些方法虽然直观,但对工作人员经验要求较高,易受个人主观性影响,且参数率定的效率和精度都比较低。随着计算机技术的发展,遗传算法、粒子群算法等现代智能算法被广泛应用于水文预报模型参数自动率定领域,弥补了传统方法的不足,然而,虽然现代智能算法能够广泛搜索解的范围,但存在着早熟和易于陷入局部最优解的问题,从本文档来自技高网...

【技术保护点】
1.一种基于深度强化学习的水文预报模型参数率定方法,其特征在于,包括以下步骤:/n步骤1、选定水文预报模型及确定所需率定参数;所述的水文预报模型以降雨及蒸发时间序列作为输入,以预报流量的时间序列作为输出;/n步骤2、建立水文预报模型参数率定的强化学习模型;所述的强化学习是指智能体Agent与环境交互学习的过程,其强化学习的关键三要素为状态空间、动作空间和奖励值函数;/n步骤3、应用深度强化学习方法DQN,优化水文预报模型率定的参数。/n

【技术特征摘要】
1.一种基于深度强化学习的水文预报模型参数率定方法,其特征在于,包括以下步骤:
步骤1、选定水文预报模型及确定所需率定参数;所述的水文预报模型以降雨及蒸发时间序列作为输入,以预报流量的时间序列作为输出;
步骤2、建立水文预报模型参数率定的强化学习模型;所述的强化学习是指智能体Agent与环境交互学习的过程,其强化学习的关键三要素为状态空间、动作空间和奖励值函数;
步骤3、应用深度强化学习方法DQN,优化水文预报模型率定的参数。


2.根据权利要求1所述的一种基于深度强化学习的水文预报模型参数率定方法,其特征在于,在所述步骤1中,选定水文预报模型及确定若干率定参数的过程包括:
根据流域特性选取不同的水文预报模型,确定该水文预报模型所需要率定的参数N为水文预报模型所需率定参数的个数;
每个参数的取值范围:



其中,分别为第i个率定参数的最小值和最大值。


3.根据权利要求1所述的一种基于深度强化学习的水文预报模型参数率定方法,其特征在于:所述步骤2中建立水文预报模型参数率定的强化学习模型,其过程包括:
2-1)确定强化学习的状态空间:
定义t时刻强化学习状态值为水文预报模型的数个率定参数组成的一维向量st;



其中为当前t时刻水文预报模型率定参数值;
t时刻参数值变化具有两种可能:增大或减小;设参数增大或减小幅度均为Δi,则t+1时刻参数值可能为或
2-2)确定强化学习的动作空间:
定义强化学习动作空间A为各个率定参数变化的所有可能情况:



其中,2N为强化学习动作空间中动作的个数;矩阵A的每一行为选定的动作,即t时刻动作值at的可能值;
2-3)确定强化学习的奖励值函数:
设为M个时段的实测的流量值,其中为第i个时段的实测流量值;
根据t时刻状态t+1时刻通过水文预...

【专利技术属性】
技术研发人员:胡鹤轩吴雨霏胡强朱跃龙张晔胡震云
申请(专利权)人:河海大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1