【技术实现步骤摘要】
本专利技术涉及智能水利,尤其涉及一种水库调度模型的训练方法及水库调度系统。
技术介绍
1、在水利行业中,进行水库调度时,调度决策的确定需要考虑多种因素,如水库的水位、入库流量、天气等。通过人工经验或通过基于数学模型的优化算法确定调度决策的方式,难以适应快速变化的气象条件和复杂的调度目标。而强化学习技术作为一种动态决策优化方法,能够在动态变化的环境中自动寻找最优策略,故使用基于强化学习技术得到的水库调度模型进行调度决策的确定,已成为主流的方式。
2、因此,如何提高基于强化学习技术训练得到的水库调度模型输出的调度决策的准确度,是重要问题。
3、基于此,本申请说明书提供了一种水库调度模型的训练方法及水库调度系统。
技术实现思路
1、鉴于现有技术的上述缺点、不足,本专利技术提供一种水库调度模型的训练方法及水库调度系统,该方法在训练水库调度模型时,根据水库调度模型预测的闸门开度,通过水文模型得到更新后的水库的状态以及预测的闸门开度对应的奖励值。并根据得到水库的闸门开度为预测的
...【技术保护点】
1.一种水库调度模型的训练方法,其特征在于,所述水库调度模型包括第一策略网络、第二策略网络、第一价值网络以及第二价值网络;所述方法包括:
2.如权利要求1所述的方法,其特征在于,调整所述水库调度模型的参数,具体包括:
3.如权利要求2所述的方法,其特征在于,调整所述水库调度模型的参数,具体包括:
4.如权利要求1所述的方法,其特征在于,调整所述水库调度模型的参数,具体包括:
5.如权利要求1所述的方法,其特征在于,在训练过程中,针对每轮训练,调整所述第一价值网络的参数的顺序位于调整所述第一策略网络的参数之前,调整所述第二
...【技术特征摘要】
1.一种水库调度模型的训练方法,其特征在于,所述水库调度模型包括第一策略网络、第二策略网络、第一价值网络以及第二价值网络;所述方法包括:
2.如权利要求1所述的方法,其特征在于,调整所述水库调度模型的参数,具体包括:
3.如权利要求2所述的方法,其特征在于,调整所述水库调度模型的参数,具体包括:
4.如权利要求1所述的方法,其特征在于,调整所述水库调度模型的参数,具体包括:
5.如权利要求1所述的方法,其特征在于,在训练过程中,针对每轮训练,调整所述第一价值网络的参数的顺序位于调整所述第一策略网络的参数之前,调整所述第二价值网络以及所述第二策略网络的参数的顺序均...
【专利技术属性】
技术研发人员:桂发二,秦兆雨,罗源,
申请(专利权)人:浙江贵仁信息科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。