【技术实现步骤摘要】
本专利技术涉及电力系统运行与控制,具体为一种基于强化学习的配电网故障恢复方法及系统。
技术介绍
1、在过去几十年里,随着电力系统的不断扩张和复杂化,配电网的稳定和可靠运行成为了电力系统设计和运维中的一个核心问题;特别是在面对自然灾害、设备老化、操作失误等导致的电网故障时,如何快速有效地恢复供电,减少故障对消费者的影响,成为了电力系统研究的重要课题。
2、近年来,随着计算机技术、人工智能和数据科学的飞速发展,基于数据驱动的决策支持系统在配电网故障恢复领域得到了广泛应用;特别是机器学习和强化学习技术的引入,为解决配电网的动态优化问题提供了新的思路和方法;强化学习,尤其是最大熵强化学习(softactor-critic,sac)和批量限制强化学习,通过从历史数据中学习最优策略,展现出在处理配电网故障恢复问题上的巨大潜力。
3、尽管强化学习在配电网故障恢复方面取得了进展,但现有技术仍存在一些不足之处;首先,大多数现有方法依赖于与环境的实时交互来学习最优策略,这在真实的电力系统中往往是不可行的,因为实时交互可能导致系统稳定
...【技术保护点】
1.一种基于强化学习的配电网故障恢复方法,其特征在于,包括:
2.如权利要求1所述的一种基于强化学习的配电网故障恢复方法,其特征在于:所述将配电网故障恢复模型转化为马尔可夫决策过程包括构建配电网故障恢复模型,将配电网故障恢复模型转化为马尔可夫决策过程;
3.如权利要求2所述的一种基于强化学习的配电网故障恢复方法,其特征在于:所述获得批量限制柔性演员-评论家算法包括将SAC和批量限制强化学习结合,获得批量限制柔性演员-评论家算法;
4.如权利要求3所述的一种基于强化学习的配电网故障恢复方法,其特征在于:所述获得批量限制柔性演员-评论家
...【技术特征摘要】
1.一种基于强化学习的配电网故障恢复方法,其特征在于,包括:
2.如权利要求1所述的一种基于强化学习的配电网故障恢复方法,其特征在于:所述将配电网故障恢复模型转化为马尔可夫决策过程包括构建配电网故障恢复模型,将配电网故障恢复模型转化为马尔可夫决策过程;
3.如权利要求2所述的一种基于强化学习的配电网故障恢复方法,其特征在于:所述获得批量限制柔性演员-评论家算法包括将sac和批量限制强化学习结合,获得批量限制柔性演员-评论家算法;
4.如权利要求3所述的一种基于强化学习的配电网故障恢复方法,其特征在于:所述获得批量限制柔性演员-评论家算法还包括状态-动作组合的外推误差∈π(s,a)和状态-动作组合的策略外推误差∈π,表示为:
5.如权利要求4所述的一种基于强化学习的配电网故障恢复方法,其特征在于:所述获得批量限制柔性演员-评论家算法还包括历史行为策略与实时策略的差异性,为构建奖励函数的影响因素,将sac与批量限制强化学习结合,构建奖励函数;
6.如权利要求5所述的一种基于强化学...
【专利技术属性】
技术研发人员:周杨珺,黄伟翔,易辰颖,张炜,李珊,潘俊涛,奉斌,颜丽娟,秦丽文,
申请(专利权)人:广西电网有限责任公司电力科学研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。