【技术实现步骤摘要】
一种基于强化学习的配电网重构优化方法
[0001]本专利技术涉及配电网重构(DNR)领域,提出一种基于Q学习的框架用于优化配电网网络结构以提高配电网系统的可靠性。
技术介绍
[0002]各类风力、光伏发电呈现出“点多面广、局部高密度并网”的爆发式增长态势。电网形态发生了重大改变,新能源、储能、电力交易等新型技术和商业模式将快速发展,同时电力用户对配电网可靠性也有更高的要求。配电网一旦发生故障或者遭受极端灾害破坏时会造成巨大的经济损失,电力公司的目标是利用可用资源可靠且经济地为用户供电,因此增强配电系统的可靠性为客户提供不间断的电力供应是必要的。可以通过两种方式加强配电系统的可靠性:(a)智能电网优化可用资源(b)在正常电力设备的基础上安装冗余资源。选择安装冗余资源的方式不仅经济效益差而且会造成资源浪费,因此,配电网系统增强可靠性的最佳方式是优化分配配电网系统现有资源。
[0003]近年来,在配电网重构优化方面进行了大量工作,许多基于分析的智能算法的出现提供了解决DNR问题的思路,例如遗传算法、混合整数二次规划、蚁群搜 ...
【技术保护点】
【技术特征摘要】
1.一种基于强化学习的配电网重构优化方法,其特征在于,包括以下步骤:(1)将配电网络初始化数据作为初始输入数据G=(N,ε)代入到配电网重构优化框架中计算公式(1)得出的初始平均损耗功率其中N是节点的集合,ε是边的集合,初始化深度神经网络的权重系数;其中P
d,k
是节点k的功率需求;Ω
k
是节点集合;U
k
是节点k年均不可用电持续时长;(2)根据深度神经网络中的前向传播流程将配电网系统初始化值G=(N,ε)、权重w代入公式(3)计算得到框架预测的预测值Q(S
t
,A
t
);其中,A
t
和S
t
分别是代理在第t次迭代的动作和状态;Q(S
t
,A
t
)是第t次迭代的动作
‑
价值函数;α是学习率;γ是奖励因子;R
t+1
是代理在第t+1次迭代选择动作后得到的回报值;a表示代理即选择了动作的代理;(3)启动贪婪算法选择动作将动作A
t
代入到公式(5)得到目标值y
t
,将目标值y
t
和步骤(2)的预测值Q(S
t
,A
t
)代入到公式(4)得到均方误差L(θ);其中R(S
t
,A
t
)表示第t次迭代的奖励函数;θ
′
表示动作
‑
奖励函数Q(S
t+1
,A
t+1
)的参数;...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。