一种电力系统的最优潮流计算方法、装置及存储介质制造方法及图纸

技术编号:28496416 阅读:36 留言:0更新日期:2021-05-19 22:30
本发明专利技术公开了一种电力系统的最优潮流计算方法,包括:S1:根据电力系统的节点参数和发电机参数,构建所述电力系统的最优潮流计算环境;S2:采用多智能体异步并行的深度强化学习算法,对所述最优潮流计算环境进行求解,获取不同负荷水平下的最优潮流结果。本发明专利技术还对应公开一种电力系统的最优潮流计算装置及存储介质。本发明专利技术实施例通过采用多智能体异步并行的深度强化学习算法求解电力系统的最优潮流问题,能够提高模型的泛化能力,同时提高了训练效率。练效率。练效率。

【技术实现步骤摘要】
一种电力系统的最优潮流计算方法、装置及存储介质


[0001]本专利技术涉及电力系统自动化
,尤其涉及一种电力系统的最优潮流计算方法、装置及存储介质。

技术介绍

[0002]电力系统的最优潮流问题(Optimal Power Flow,OPF)是指在满足电力系统的各种物理约束下,调整电力系统的各种控制变量,使得设定的目标函数最小化的优化过程。具体而言,目标函数主要有总发电费用和全网网损等,控制变量主要有发电机出力、发电机端电压和变压器分接头等,约束主要有功率平衡约束、节点电压约束、发电机出力约束和线路潮流约束等。
[0003]最优潮流问题需要同时考虑电力系统运行的经济性和安全性,比传统的经济调度问题更有实际意义,在电力系统的安全运行和经济调度等方面有广泛应用。目前,针对最优潮流问题的经典算法,主要有线性规划法、简化梯度法、牛顿法、内点法和无限点优化法等,由于经典算法都是基于梯度的计算方法,在实际应用中有以下缺点:计算耗时长,无法实现在线计算;随着系统规模的增大,出现“维度灾难”;目标函数和约束必须连续可微,难以处理离散控制变量。...

【技术保护点】

【技术特征摘要】
1.一种电力系统的最优潮流计算方法,其特征在于,包括以下步骤:S1:根据电力系统的节点参数和发电机参数,构建所述电力系统的最优潮流计算环境;S2:采用多智能体异步并行的深度强化学习算法,对所述最优潮流计算环境进行求解,获取不同负荷水平下的最优潮流结果。2.如权利要求1所述的电力系统的最优潮流计算方法,其特征在于,所述步骤S1具体为:根据节点电压幅值、节点电压相角、发电机有功出力、发电机无功出力、负载有功功率和负载无功功率,构建状态空间,满足以下公式:其中,V为节点电压幅值,为节点电压相角,P
g
为发电机有功出力,Q
g
为发电机无功出力,P
l
为负载有功功率,Q
l
为负载无功功率;根据发电机端电压和PV节点发电机的有功出力,构建动作空间;u=(V
g
,P
gc
),(2)其中,V
g
为发电机端电压,P
gc
为所有PV节点发电机的有功出力;构建最小网损目标函数,满足以下公式:min C(x,u)=∑P
g

∑P
l
,(3)s.t.g(x,u)=0,(4)P
gmmin
≤P
g
≤P
gmax
,(5)Q
gmin
≤Q
g
≤Q
gmax
,(6)V
min
≤V≤V
max
,(7)其中,C表示网损目标函数,g(x,u)=0表示电力系统潮流等式约束条件,V
min
表示节点最小电压幅值,V
max
表示节点最大电压幅值,Q
gmin
表示发电机最小无功出力,Q
gmax
表示发电机最大无功出力;构建所述最优潮流计算环境的奖励函数,满足以下公式:R=

C

σN,(8)其中,N表示当前结果违反不等式约束的个数,σ表示不等式约束的惩罚系数;根据所述状态空间、所述动作空间和所述奖励构建电力系统的最优潮流计算环境。3.如权利要求2所述的电力系统的最优潮流计算方法,其特征在于,所述步骤S2具体为:S2

1:构建全局智能体和至少一个局部智能体;其中,所述全局智能体包括全局策略网络和全局价值网络,所述局部智能体包括局部策略网络和局部价值网络;S2

2:初始化全局智能体参数;其中所述全局智能体参数包括全局策略网络参数和全局价值网络参数;S2

3:根据所述全局智能体参数更新局部智能体参数;其中,所述局部智能体参数包括局部策略网络参数和局部价值网络参数;S2

4:在预设的负荷水平下从所述最优潮流计算环境随机采样获得初始状态x0作为当前状态x
t
,执行一轮训练,计算当轮训练的局部策略网络更新量和局部价值网络更新量,并分别根据所述局部策略网络更新量和局部价值网络更新量更新所述局部策略网络参数和
局部价值网络参数,并将所述局部策略网络更新量和所述局部价值网络更新量存至更新量缓存器中;S2

5:当训练轮数为第一预设值的正整数倍时,分别根据所述局部策略网络更新量和所述局部价值网络更新量更新全局策略网络参数和全局价值网络参数;当所述训练轮数不为所述第一预设值的正整数倍时,则回到步骤S2

4;S2

6:当所述训练轮数不小于第二预设值时,则终止训练;当所述训练轮数小于所述第二预设值时,则回到步骤S2

3。4.如权利要求3所述的电力系统的最优潮流计算方法,其特征在于,所述步骤S2

4具体为:S2
‑4‑
1:在预设的负荷水平下从所述状态空间中获得随机的初始状态x0作为当前状态x
t
;S2
‑4‑
2:根据所述当前状态x
t
,基于局部策略网络获得动作ut;S2
‑4‑
3:执行动作ut,获得新状态x
t+1
,并根据奖励函数给出奖励r
t+1
;S2
‑4‑
4:当所述奖励r
t+1
满足控制终止条件时,则转至步骤S2
‑4‑
6,当所述奖励r
t+1
不满足控制终止条件时,则将数据以向量(x
t
,u
t
,x
t+1
,r
t+1
)的形式存至控制序列缓存器;S2
‑4‑
5:当控制次数小于预设阈值时,则回到步骤S2
‑4‑
2;当所述控制次数不小于预设阈值时,则转至步骤S2
‑4‑
6;S2
‑4‑
6:根据所述控制序列缓存器中的数据计算得局部策略网络更新量和局部价值网络更新量,并将所述局部策略网络更新量和所述局部价值网络更新量存至更新量缓存器中;S2
‑4‑
7:分别根据所述局部策略网络更新量和所述局部价值网络更新量更新所述局部策略网络参数和局部价值网络参数。5.一种电力系统的最优潮流计算装置,其特征在于,包括:环境构建模块,用于执行步骤S1:根据电力系统的节点参数和发电机参数,构建所述电力系统的最优潮流计算环境;最优潮流求解模块,用于执行步骤S2:采用多智能体异步并行的深度强化学习算法,对所述最优潮流计算环境进行求解,获取不同负荷水平下的最优潮流结果。6.如权利要求5所述的电力系统的最优潮流计算装置,其特征在于,所述环境构建模块具体包括状态空间构建单元、动作空间构建单元、最小网损目标函数构建单元、奖励函数构建单元和环境构建单元;所述状态空间构建单元,用于根据节点电压幅值、节点电压相角、发电机有功出力、发电机无功出力、负载有功功率和负载无功功率,构建状态空间,满足以下公式:其中,V为节点电压幅值,为节点电压相角,P
g
为发电机有功出力...

【专利技术属性】
技术研发人员:甄鸿越马伟哲赵利刚翁毅选徐原史军江出阳齐晖洪潮林小朗翟鹤峰何晓峰
申请(专利权)人:深圳供电局有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1