【技术实现步骤摘要】
一种基于深度强化学习和图注意力机制的电力稳控方法
[0001]本专利技术属于电力系统紧急控制领域,尤其涉及一种基于深度强化学习和图注意力机制的电力稳控方法
。
技术介绍
[0002]随着新型电力系统的建设,系统的动态行为日益复杂,导致系统的暂态稳定面临严峻挑战
。
暂态失稳的传播速度快,影响范围广,一旦发生电力失稳事故可能引起系统崩溃,严重影响居民的社会生活,给我国经济造成重大损失
。
因此,故障发生后,及时
、
有效的采取紧急控制措施对保持系统暂态稳定
、
保障电力系统安全经济运行具有重要意义
。
紧急控制策略的制定和实施可以分为三类
。
其中,“离线预决策,实时匹配”和“在线预决策,实时匹配”可以快速通过决策表选择决策,但缺乏对现代电力系统复杂多变的运行场景的灵活适应性
。
因此,研究脱离决策表
、
完全基于响应的“实时决策
、
实时匹配”的紧急控制方式是亟待解决的问题
。
[0003]目前,广域测量系统和相量测量单元的广泛应用,使现代电力系统可观性得到巨大提升,为基于实时响应信息的紧急控制提供了有力的硬件和软件支撑
。
现有的暂态稳定紧急控制的研究主要分为时域仿真法
、
能量函数法以及基于响应和人工智能的方法3类
。
时域仿真法将紧急控制问题转化为优化控制问题,但由于约束条件过多,不适于大规模电力系 ...
【技术保护点】
【技术特征摘要】
1.
一种基于深度强化学习和图注意力机制的电力稳控方法,其特征在于,包括以下步骤:
(1)
设计切机方案:针对电网失稳的系统设计以使系统稳定的切机方案,该切机方案通过稳控模型获取;
(2)
设计基于图注意力机制的神经网络:针对电网拓扑结构设计基于图注意力机制的神经网络,该神经网络基于电网拓扑信息通过图注意力机制来提取电网的物理特征;
(3)
设计深度强化学习流程:根据切机方案和神经网络设计对深度强化学习流程中的动作空间
、
状态空间
、
奖励函数,根据切机方案使用稳控模型对失稳系统进行控制
。2.
根据权利要求1所述的基于深度强化学习和图注意力机制的电力稳控方法,其特征在于,所述步骤
(1)
包括以下子步骤:
(1.1)
设计离线阶段的稳控模型训练方案:通过电力仿真软件生成训练样本,使用训练样本对稳控模型进行批量训练,以获取训练好的稳控模型;
(1.2)
设计在线应用阶段方案:使用电网监测工具对电网系统进行实时监测,当监测到系统失稳时,则使用训练好的稳控模型对系统进行切机以使系统回到稳定状态
。3.
根据权利要求2所述的基于深度强化学习和图注意力机制的电力稳控方法,其特征在于,所述离线阶段的训练流程具体包括:
(1.1.1)
获取失稳样本进入
episode
,初始状态
episode
=0,后续每次
episode
增加1;
(1.1.2)
开始第一个
step
,进行时域仿真获取
t
时刻的电网状态;
(1.1.3)
根据暂态稳定指数判断系统是否失稳,若暂态稳定指数小于0,则系统失稳,智能体根据
t
时刻的电网状态选择一个动作;若暂态稳定指数大于等于0,则系统稳定,当前
episode
结束;
(1.1.4)
判断当前
episode
的
step
是否达到预设的规定上限值,若未达到,当前
step
结束,进入下一个
step
;若达到,则当前
episode
结束;
(1.1.5)
进入下一个
step
后,系统通过时域仿真执行上个
step
智能体选出的动作,得到
t+1
时刻的电网状态,并给出奖励值
R
;
(1.1.6)
当系统失稳时,智能体先通过奖励值调整自身的决策,然后再根据
t+1
时刻的电网状态选出动作,最后进入步骤
(1.1.4)
;
(1.1.7)
判断
episode
数量是否达到预设的
episode
规定值,若
episode
数量达到规定值,则训练结束,得到训练好的稳控模型;否则,返回步骤
(1.1.1)。4.
根据权利要求2所述的基于深度强化学习和图注意力机制的电力稳控方法,其特征在于,所述在线应用阶段的流程具体包括:
(1.2.1)
通过电网监测工具获取电网运行过程中
t
时刻的状态;
(1.2.2)
通过训练好的稳控模型选择一个动作并执行;
(1.2.3)
根据暂态稳定指数判断系统是否失稳,若暂态稳定指数小于0,则系统...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。