【技术实现步骤摘要】
基于强化学习的无功电压优化方法、装置、设备及介质
[0001]本申请涉及电压控制
,尤其涉及一种基于强化学习的无功电压优化方法、装置、设备及介质。
技术介绍
[0002]随着数字配电网接入越来越多的分布式电源,高渗透率的分布式电源并网会引起电压波动或者电压过高导致其脱网,严重制约主动配电网消纳可再生能源发电的能力,浪费电网资源和可再生能源。为此,主动配电网会利用无功电压控制算法,通过控制无功可调资源,实现降低网损和改善电压的目的。
[0003]目前,传统配电网电压控制算法主要基于模型驱动,包括集中式算法和分布式算法。集中式算法需要实时获取电网的状态信息,容易受到通信质量影响。分布式算法通常不需要与邻居通信,但是其优化效果严重依赖于配电网模型和参数精确性。而主动配电网具有高度非线性异构时变等复杂特性,以及存在配电网规模大和量测稀疏等因素,导致模型参数存在严重不确定性,从而导致在实际应用中难于获得高精度的配电网模型。可见,传统模型驱动优化控制方法难以适应业务需求。
技术实现思路
[0004]本申请提 ...
【技术保护点】
【技术特征摘要】
1.一种基于强化学习的无功电压优化方法,其特征在于,包括:利用深度学习算法,以实际配电网的历史工况数据为输入,以基于名义模型得到的无功电压优化数据为训练标签,训练预设深度学习优化器,得到第一策略模型,所述历史工况数据包括发电有功功率、负载有功功率和负载无功功率;利用马尔可夫决策过程,根据所述第一策略模型,生成无功优化智能体;基于所述无功优化智能体与实际配电网进行实时交互,以对所述实际配电网进行无功电压优化,以及利用强化学习算法,更新所述无功优化智能体。2.如权利要求1所述的基于强化学习的无功电压优化方法,其特征在于,所述利用深度学习算法,以实际配电网的历史工况数据为输入,以基于名义模型得到的无功电压优化数据为训练标签,训练预设深度学习优化器,得到第一策略模型,包括:利用所述名义模型,根据所述历史工况数据,输出所述无功电压优化数据;利用所述预设深度学习优化器,根据所述历史工况数据,输出无功电压控制数据;基于所述无功电压优化数据和所述无功电压控制数据,计算所述预设深度学习优化器的第一损失函数;基于所述第一损失函数更新所述预设深度学习优化器,并确定所述预设深度学习优化器是否达到收敛条件;若所述第一损失函数达到最小值,则判定所述预设深度学习优化器达到收敛条件,得到所述第一策略模型。3.如权利要求2所述的基于强化学习的无功电压优化方法,其特征在于,所述利用所述名义模型,根据所述历史工况数据,输出所述无功电压优化数据,包括:利用所述名义模型,根据所述历史工况数据,对所述实际配电网进行潮流分析,输出所述无功电压优化数据,所述名义模型为:述无功电压优化数据,所述名义模型为:其中,r
p
(x
t
,u
t
)为网损或发电成本,x
t
为因变量,u
t
为控制变量,D
t
为包含所述历史工况数据的扰动变量,b为主动配电网模型的模型参数,A为主动配电网模型的拓扑结构,g表示潮流方程,h
v
表示电压与控制变量的不等式约束方程。4.如权利要求1所述的基于强化学习的无功电压优化方法,其特征在于,所述利用马尔可夫决策过程,根据所述第一策略模型,生成无功优化智能体,包括:在所述马尔可夫决策过程中,以预设强化学习智能体观测实际配电网在当前时刻下的第一状态信息,所述第一状态信息包括节点注入有功功率、节点注入无功功率、节点电压和无功输出功率;利用所述第一策略模型,选择所述第一状态信息对应的第一动作信息,并计算所述预设强化学习智能体的第一奖励信息和观测下一时刻下的状态信息,以生成所述无功优化智能体。5.如权利要求1所述的基于强化学习的无功电压优化方法,其特征在于,所述基于所述无功优化智能体与实际配电网进行实时交互,以对所述实际配电网进行无功电压优化,以
及利用...
【专利技术属性】
技术研发人员:戴月,郭文鑫,柳琼,郭烨,余志文,卢建刚,曾凯文,郑文杰,
申请(专利权)人:广东电网有限责任公司电力调度控制中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。