一种水库调度模型的训练方法及水库调度系统技术方案

技术编号:45917526 阅读:14 留言:0更新日期:2025-07-25 17:47
本发明专利技术涉及智能水利技术领域,尤其涉及一种水库调度模型的训练方法及水库调度系统。水库调度模型包括第一策略网络、第二策略网络、第一价值网络以及第二价值网络。获取水库的第一状态,该水库为基于预设的水文模型提供的仿真环境中的仿真水库。基于第一状态,得到第一策略网络输出的第一闸门开度,并通过第一价值网络,得到第一价值。通过水文模型,确定水库的第二状态以及奖励值,根据第二状态,确定在水库的闸门开度为第一闸门开度时水库的实际蓄水量。将第二状态输入第二策略网络,得到水库的第二闸门开度,并通过第二价值网络,得到第二价值。根据第一闸门开度、实际蓄水量、奖励值、第一价值以及第二价值,调整水库调度模型的参数。

【技术实现步骤摘要】

本专利技术涉及智能水利,尤其涉及一种水库调度模型的训练方法及水库调度系统


技术介绍

1、在水利行业中,进行水库调度时,调度决策的确定需要考虑多种因素,如水库的水位、入库流量、天气等。通过人工经验或通过基于数学模型的优化算法确定调度决策的方式,难以适应快速变化的气象条件和复杂的调度目标。而强化学习技术作为一种动态决策优化方法,能够在动态变化的环境中自动寻找最优策略,故使用基于强化学习技术得到的水库调度模型进行调度决策的确定,已成为主流的方式。

2、因此,如何提高基于强化学习技术训练得到的水库调度模型输出的调度决策的准确度,是重要问题。

3、基于此,本申请说明书提供了一种水库调度模型的训练方法及水库调度系统。


技术实现思路

1、鉴于现有技术的上述缺点、不足,本专利技术提供一种水库调度模型的训练方法及水库调度系统,该方法在训练水库调度模型时,根据水库调度模型预测的闸门开度,通过水文模型得到更新后的水库的状态以及预测的闸门开度对应的奖励值。并根据得到水库的闸门开度为预测的闸门开度时水库的实际本文档来自技高网...

【技术保护点】

1.一种水库调度模型的训练方法,其特征在于,所述水库调度模型包括第一策略网络、第二策略网络、第一价值网络以及第二价值网络;所述方法包括:

2.如权利要求1所述的方法,其特征在于,调整所述水库调度模型的参数,具体包括:

3.如权利要求2所述的方法,其特征在于,调整所述水库调度模型的参数,具体包括:

4.如权利要求1所述的方法,其特征在于,调整所述水库调度模型的参数,具体包括:

5.如权利要求1所述的方法,其特征在于,在训练过程中,针对每轮训练,调整所述第一价值网络的参数的顺序位于调整所述第一策略网络的参数之前,调整所述第二价值网络以及所述第二...

【技术特征摘要】

1.一种水库调度模型的训练方法,其特征在于,所述水库调度模型包括第一策略网络、第二策略网络、第一价值网络以及第二价值网络;所述方法包括:

2.如权利要求1所述的方法,其特征在于,调整所述水库调度模型的参数,具体包括:

3.如权利要求2所述的方法,其特征在于,调整所述水库调度模型的参数,具体包括:

4.如权利要求1所述的方法,其特征在于,调整所述水库调度模型的参数,具体包括:

5.如权利要求1所述的方法,其特征在于,在训练过程中,针对每轮训练,调整所述第一价值网络的参数的顺序位于调整所述第一策略网络的参数之前,调整所述第二价值网络以及所述第二策略网络的参数的顺序均...

【专利技术属性】
技术研发人员:桂发二秦兆雨罗源
申请(专利权)人:浙江贵仁信息科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1