一种基于进化学习和深度强化学习的电压调节方法及系统技术方案

技术编号:33086611 阅读:21 留言:0更新日期:2022-04-15 10:51
本发明专利技术公开了一种基于进化学习和深度强化学习的电压调节方法及系统,属于人工智能与控制系统交叉技术领域,包括:获取实时检测到的环境状态,将其输入已训练的策略网络,得到电压调节策略;根据电压调节策略调动调压资源完成电压调节;所述策略网络通过以下方法训练:对策略网络进行多阶段递进式多节点深度强化学习的训练,每阶段训练中应用进化学习,通过已训练的策略网络之间的交叉使已训练的策略网络数量翻倍,在进行交叉操作的下一个阶段中对已训练的策略网络进行变异操作,直至已训练的策略网络数量达到预设目标;每个节点对应一个策略网络;适用于多节点的配电网协同电压调节,促进网络训练过程的多样性,具有强大的可拓展性。可拓展性。可拓展性。

【技术实现步骤摘要】
一种基于进化学习和深度强化学习的电压调节方法及系统


[0001]本专利技术涉及一种基于进化学习和深度强化学习的电压调节方法及系统,属于人工智能与控制系统交叉


技术介绍

[0002]随着我国双碳目标的提出以及新能源发电技术的快速发展,高比例分布式新能源接入配电网给电网安全运行带来极大挑战;分布式新能源出力的间歇性、随机性以及发电与负荷的不平衡性很容易造成馈线节点电压的越线问题,现有配电网电压控制具有局部调节、依赖外接设备的特点,随着外接调节资源的耗尽,逐渐无法满足分散式新能源高比例接入下的配电网电压调节需求,因此,如何有效协同高比例新能源有功无功出力对电网电压调节具有重要现实意义。
[0003]目前基于传统的配电网电压调节方法有数学优化法、智能优化法、随机优化法和模型预测法等,这些方法虽然能够对电压调节起到一定效果,但是这些方法普遍存在计算量大、容易陷入局部最优、严重依赖预测数据和难以实现在线控制等问题,而且,现有配电网通信基础设施差,信息交互仅局限于部分可观测节点,同时,传统调压方法对模型的精度要求较高,难以应用于新形态高比例本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于进化学习和深度强化学习的电压调节方法,其特征在于,包括:获取实时检测到的环境状态,将其输入已训练的策略网络,得到电压调节策略;根据电压调节策略调动调压资源完成电压调节;所述策略网络通过以下方法训练:对策略网络进行多阶段递进式多节点深度强化学习的训练,每阶段训练中应用进化学习,通过已训练的策略网络之间的交叉使已训练的策略网络数量翻倍,在进行交叉操作的下一个阶段中对已训练的策略网络进行变异操作,直至已训练的策略网络数量达到预设目标;每个节点对应一个策略网络。2.根据权利要求1所述的一种基于进化学习和深度强化学习的电压调节方法,其特征在于,还包括根据所述调压资源建立电压调节目标优化函数的步骤:其中,N是配电网总节点个数,S是电压调节周期,V
n,t
是t时刻第n个节点的实时测量电压,V
n,ref
是第n个节点的参考电压,α1和α2分别是节点和柔性负荷有功功率电压调节成本权重系数,ΔP
n,RES,t
是第n个节点的有功调节量,P
n,FL,t
是柔性负荷有功调节量,ω是电压偏移安全范围惩罚权重系数。3.根据权利要求1所述的一种基于进化学习和深度强化学习的电压调节方法,其特征在于,所述策略网路基于自注意力机制建立,其函数表示为:P
n
(x)=h
n
([g
n
(f
n
(o
n
)),v
n
])其中,o
n
是第n个节点的观测,f
n
(o
n
)是第n个节点的观测编码,g
n
是一层全连接神经网络,h
n
是两层全连接神经网络,v
n
是第n个节点对其余节点观测

动作编码的加权和。4.根据权利要求3所述的一种基于进...

【专利技术属性】
技术研发人员:岳东张廷军窦春霞余亮丁孝华赵景涛郑舒
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1