一种基于大模型指导强化学习的配电网供电恢复决策方法技术

技术编号:46488234 阅读:6 留言:0更新日期:2025-09-26 19:08
本发明专利技术公开了一种基于大模型指导强化学习的配电网供电恢复决策方法,获取配电网供电恢复问题的任务描述信息,基于此构建配电网供电恢复问题的马尔可夫决策过程。基于马尔科夫决策过程,搭建强化学习环境,并构建k个采用DDQN算法的强化学习模型。利用大模型的代码生成与优化能力,自动生成k个高质量的奖励函数代码,并用于训练强化学习模型。同时设计配电网供电恢复问题的奖励函数反馈提示和代码格式化提示,通过在每轮迭代后采用任务适应度函数评估强化学习模型的整体性能,并结合奖励反思机制动态优化奖励函数。采用多次随机重启策略,有效降低搜索陷入局部最优的风险。本发明专利技术可在复杂的配电网环境下生成高效、稳定的供电恢复方案。

【技术实现步骤摘要】

本专利技术涉及电力系统配电网供电恢复的,尤其是指一种基于大模型指导强化学习的配电网供电恢复决策方法


技术介绍

1、近年来,极端事件导致的大规模停电事故频繁发生,保障新型电力系统安全,已成为重要且紧迫的任务。然而,新型配电网的随机性和不确定性上升,给系统分析和决策带来了巨大的挑战,维持新型配电网安全稳定运行的难度大幅提升。极端事件下,快速可靠地完成配电网供电恢复过程是保障电力系统安全的重要手段,如何在新型配电网背景下,研究极端事件下智能配电网的供电恢复,减少停电事故带来的经济损失和社会影响具有重要意义。

2、配电网供电恢复问题该主要采用基于混合整数规划的算法进行求解,该方法具备严格的最优性保证和较强的建模灵活性,但仍存在以下不足:1)随着配电网规模的扩大、拓扑结构的复杂化以及可控资源的多样化,配电网供电恢复问题的计算复杂度显著增加,使得基于混合整数规划的求解方法在大规模系统中求解时间大幅上升,难以满足实时决策的需求;2)该方法高度依赖于精确的数学建模,当系统参数存在误差或信息不完整时,可能难以提供稳定可靠的供电恢复方案,影响方法的适用性。...

【技术保护点】

1.一种基于大模型指导强化学习的配电网供电恢复决策方法,其特征在于,该方法是利用大模型的代码生成和优化能力,自动生成高质量的奖励函数,以指导强化学习模型优化供电恢复策略,包括以下步骤:

2.根据权利要求1所述的一种基于大模型指导强化学习的配电网供电恢复决策方法,其特征在于:在步骤S1,所述安全约束条件包括:潮流约束、节点电压约束、节点功率平衡约束、线路功率约束和辐射状运行约束;所述配电网参数包括配电网拓扑结构、开关安装位置、负荷需求和曲线及分布式电源的类型和容量。

3.根据权利要求2所述的一种基于大模型指导强化学习的配电网供电恢复决策方法,其特征在于:在步骤S1,...

【技术特征摘要】

1.一种基于大模型指导强化学习的配电网供电恢复决策方法,其特征在于,该方法是利用大模型的代码生成和优化能力,自动生成高质量的奖励函数,以指导强化学习模型优化供电恢复策略,包括以下步骤:

2.根据权利要求1所述的一种基于大模型指导强化学习的配电网供电恢复决策方法,其特征在于:在步骤s1,所述安全约束条件包括:潮流约束、节点电压约束、节点功率平衡约束、线路功率约束和辐射状运行约束;所述配电网参数包括配电网拓扑结构、开关安装位置、负荷需求和曲线及分布式电源的类型和容量。

3.根据权利要求2所述的一种基于大模型...

【专利技术属性】
技术研发人员:萧文聪黄展鸿余涛罗庆全龚宇燊
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1