【技术实现步骤摘要】
一种基于深度迁移强化学习的电力系统调度优化方法
[0001]本专利技术属于电力系统
,更具体地,涉及一种基于深度迁移强化学习的电力系统调度优化方法。
技术介绍
[0002]光伏、风电等可再生能源具有安全、低污染、高发展潜力等优点,大力发展可再生能源是实现“双碳”目标的重要举措。与此同时,大规模间歇性新能源的不断并网,也使电网的不确定性持续增加,给电力系统调度提出了更高的要求。随着深度调峰,需求响应,综合能源系统的发展和建设,源荷双侧可调度能力不断加大,电网弹性不断提升,在电源侧,通过对传统火电机组进行灵活性改造使其参与深度调峰,可以有效提升电源调节潜力,促进新能源消纳;在负荷侧,随着智能电网技术的发展和完善,出现了可以根据补偿价格调整自身用电需求的柔性负荷,利用柔性负荷对电源侧发电调度进行补充,是平抑新能源发电和负荷波动,维持电网安全稳定运行和的有效手段。
[0003]随着源荷双侧弹性资源的引入,系统状态和动作维数增加,精确建模难度提升,寻优空间增大,给传统调度优化方法的应用带来巨大的挑战,而基于数据驱动的深度 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度迁移强化学习的电力系统调度优化方法,其特征在于,所述调度优化方法包括以下步骤:步骤1:确定电力系统所包含的各类资源并为其建立数学模型;步骤2:确定电力系统实时调度任务的优化目标并建立其学习优化模型;步骤3:使用神经网络输入输出维度扩展方法,将源任务神经网络参数迁移至目标任务;步骤4:网络参数迁移后采用DDPG算法进一步优化求解,获得实时调度计划。2.如权利要求1所述的基于深度迁移强化学习的电力系统调度优化方法,其特征在于,所述步骤1所述电力系统包括源任务电力系统和目标任务电力系统,所述源任务电力系统由N
g
台火电机组、N
w
个风电场、N
pv
个光伏电站和刚性负荷组成;目标任务电力系统为含弹性资源电力系统,由N
g
台火电机组、N
w
个风电场、N
pv
个光伏电站、刚性负荷和柔性负荷组成,其中N
g1
台为常规调峰机组,N
g2
台为深度调峰机组。3.如权利要求1所述的基于深度迁移强化学习的电力系统调度优化方法,其特征在于,所述步骤1目标任务电力系统中源荷双侧弹性资源包括深度调峰机组和柔性负荷,具体模型如下:深度调峰机组模型:深度调峰机组调峰过程可分为常规调峰、不投油深度调峰和投油深度调峰三个阶段,k时刻深度调峰机组i的运行成本根据其运行状态和能耗特性可统一表示为:其中,和为火电机组i在k时刻煤耗成本、机组损耗成本和投油成本,为火电机组i在k时刻出力,和分别为火电机组i的最大技术出力、最小技术出力、不投油调峰最小出力和投油调峰最小出力;柔性负荷模型:柔性负荷用电需求可在一定范围内进行削减,其可参与电网调度的部分呈现与激励价格相关的弹性可调节特性,k时刻在激励价格ζ
r,k
下,可参与电网调度的可削减部分占柔性负荷总量的比例Γ(ζ
r,k
)可表示为:
其中,和分别为响应区间的最小激励价格和最大激励价格,β、γ分别为弹性系数,和分别为k时刻柔性负荷最大可削减量和柔性负荷总量,k时刻在激励价格ζ
r,k
下柔性负荷最大调度量可表示为:则k时刻在激励价格ζ
r,k
下柔性负荷实际削减量其补偿成本C
r,k
可表示为:C
r,k
=ζ
r,k
P
r,k
。4.如权利要求1所述的基于深度迁移强化学习的电力系统调度优化方法,其特征在于,所述步骤1所述电力系统模型的约束条件包括功率平衡约束、常规火电机组出力上下限约束、深度调峰机组出力上下限约束、火电机组爬坡约束、可削减负荷削减量上下限约束和线路潮流约束,具体如下:所述功率平衡约束:其中和分别为k时刻火电机组i、风电场m和光伏电场n的出力;P
load,k
为k时刻负荷总量;所述常规火电机组出力上下限约束:其中Φ
ndpr
为常规火电机组集合;所述深度调峰机组出力上下限约束:其中Φ
dpr
为深度调峰机组集合;所述火电机组爬坡约束:其中和分别为单位调度时段火电机组i最大向上和向下爬坡的速率;所述可削减负荷削减量上下限约束:所述线路潮流约束:其中和分别为火电机组i、风电场m、光伏电场n和负荷b所在节点对线路l的功率传输分配系数;和分别为k时刻火电机组i、风电场m和光伏电
场n的出力;F
l,max
为线路l的潮流上限;N
b
为电网节点总数;为柔性负荷参与调度后,k时刻节点b的负荷值,满足5.如权利要求1所述的基于深度迁移强化学习的电力系统调度优化方法,其特征在于,所述步骤2电力系统实时优化任务优化目标,具体如下:电力系统实时优化任务优化目标为在保证系统安全稳定运行的同时运行成本最低,具体为:其中C
total
为日总运行代价,K为一天的总调度周期数,C
k
为调度周期k的运行代价,可表示为:C
k
=λ1C
g,k
+λ2C
r,k
+λ3C
a,k
+λ4C
b,k
+λ5C
pf,k
其中C
g,k
、C
r,k
、C
a,k
、C
b,k
和C
pf,k
分别为调度周期k的火电机组运行成本、柔性负荷削减补偿成本、弃风弃光成本、切负荷成本和潮流越限惩罚成本,λ1、λ2、λ3、λ4和λ5为各个成本的权重系数。6.如权利要求1所述的基于深度迁移强化学习的电力系统调度优化方法,其特征在于,所述步骤2学习优化模型的状态空间和动作空间,具体如下:含弹性资源的电力系统k时刻的系统运行状态向量由时间k、各台火电机组出力光伏电站功率风电场功率负荷实际值P
load,k
和柔性负荷最大可削减量组成,可表示为:其中为含弹性资源的电力系统的状态空间集合;第k时刻动作向量由各机组出力调整量和柔性负荷削减量组成,可表示为:其中为含弹性资源的电力系统的动作空间集合;源任务电力系统状态向量和动作向量与含弹性资源电力系统状态向量和动作向量类似,可表示为:s
k
=(k,P
g,k
,P
pv,k
,P
wind,k...
【专利技术属性】
技术研发人员:唐昊,严臻,王正风,李端超,梁肖,
申请(专利权)人:国网安徽省电力有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。