一种计及有序用电损失的需求响应定价调控方法及系统技术方案

技术编号:39596223 阅读:9 留言:0更新日期:2023-12-03 19:54
本发明专利技术涉及电力资源调控技术领域,公开了一种计及有序用电损失的需求响应调控定价方法及系统,其方法通过以一个运行日的最大收益为目标,设置各时段的需求响应电价定价和有序用电削减参数为状态变量,构建需求响应的调控收益模型,将需求响应定价优化问题描述为马尔可夫决策过程,基于多智能体强化学习算法,将需求响应电价定价和有序用电削减参数设置为决策智能体,通过历史运行数据对决策智能体进行迭代训练,求解马尔可夫决策过程,得到最佳的需求响应电价定价策略和最佳的有序用电削减参数策略,解决了决策者可能存在过分预估风险或忽视风险而造成需求响应定价的不合理,甚至造成严重的切负荷情况的问题,提高了需求响应定价准确度

【技术实现步骤摘要】
一种计及有序用电损失的需求响应定价调控方法及系统


[0001]本专利技术涉及电力资源调控
,尤其涉及一种计及有序用电损失的需求响应调控定价方法及系统


技术介绍

[0002]电力系统新能源渗透比例日益提升,通过电源侧单方面的调节管控难以完全解决新能源电力系统出力波动性强

用电峰谷差大和受天气气候影响显著等问题

特别地,在电力网架建设尚不完备的现状下,电源侧调节管控无法应对线路阻塞的情况,需要电力系统调控运行发展出负荷侧的管控手段

[0003]目前,有序用电通过对用电负荷的能耗水平与重要等级进行用电管理,在电网供电能力不足的情况下执行有序减载

需求响应则通过价格激励的方式,引导用电负荷以自发调节用电行为方式或主动接受调节的方式实现用电的削减与用电时段的调整,构造分时电价是实现需求响应的重要手段

[0004]现阶段国内外对需求响应的定价策略开展了许多研究工作,并对不同用电负荷的用电特性进行了充分考虑

需求响应需要的日前完成对下一天的电价定值,其依据是参照新能源的出力预测结果分析各时段的用电需求

然而,新能源出力难以保证绝对的准确,从而在实时运行中将造成电网运行越限的情况发生,此时通常以有序用电作为保障电网安全的最后屏障

需求响应与有序用电共同提供负荷侧管控的重要手段

[0005]但是,现阶段需求响应定价策略仍严重受限于预测精度条件,现有的需求响应与有序用电不存在决策耦合关系,换言之,决策者可能存在过分预估风险或忽视风险而造成需求响应定价的不合理,导致需求响应定价准确度不高,甚至造成严重的切负荷情况出现


技术实现思路

[0006]本专利技术提供了一种计及有序用电损失的需求响应定价调控方法及系统,解决了决策者可能存在过分预估风险或忽视风险而造成需求响应定价的不合理,导致需求响应定价准确度不高,甚至造成严重的切负荷情况出现的技术问题

[0007]有鉴于此,本专利技术第一方面提供了一种计及有序用电损失的需求响应定价调控方法,包括以下步骤:
[0008]以一个运行日的最大收益为目标,设置各时段的需求响应电价定价和有序用电削减参数为状态变量,构建需求响应的调控收益模型;
[0009]根据所述需求响应的调控收益模型将需求响应定价优化问题描述为马尔可夫决策过程;
[0010]基于多智能体强化学习算法,将所述需求响应电价定价和所述有序用电削减参数设置为决策智能体,通过历史运行数据对所述决策智能体进行迭代训练,求解马尔可夫决策过程,得到最佳的需求响应电价定价策略和最佳的有序用电削减参数策略;
[0011]通过配电网在运行日在线响应并执行所述最佳的需求响应电价定价策略和所述
最佳的有序用电削减参数策略

[0012]优选地,以一个运行日的最大收益为目标,设置各时段的需求响应电价定价和有序用电削减参数为状态变量,构建需求响应的调控收益模型的步骤,具体包括:
[0013]以一个运行日的最大收益为目标,设置各时段的需求响应电价定价和有序用电削减参数为状态变量,构建需求响应的调控收益模型的目标函数为:
[0014][0015]式中,
C
PV,t
表示新能源电源的运行费用,
C
grid,t
表示分布式电网功率平衡购电费用,
C
rev,t
表示售电盈余;其中,
[0016][0017]式中,
C
PV,OM
表示新能源电源的单位运行与维护费用,
N
PV
表示新能源电源的装配总数目,
T
表示总时间,
R
PV,n,t
表示新能源电源
n
在时间间隔
t
的发电效率,表示新能源电源
n
的额定发电功率;
[0018][0019]式中,
C
buy
表示从主电网系统购买电能量的购电价格,
C
sell
表示向主电网系统出售电能的售电价格,
P
def,t
、P
sur,t
分别表示联络线下行功率和联络线上行功率;
[0020][0021]式中,
N
D
表示负荷总数,
K
DLC,i,t
表示负荷削减率,
P
D,i,t
表示售电价格,
C
D
表示负荷侧售电电价;
[0022]考虑需求响应情况下,电价
Pr
t
与需求响应后的售电价格
P
D,i,t
之间的关系式表示为:
[0023][0024]式中,表示
t
时间间隔下的功率预测值,与均为相关计算因子;
[0025]确定约束条件为:
[0026]1)
参与需求响应后的负荷总量不小于需求响应前的负荷总量,其约束关系为:
[0027][0028]2)
电网运行约束包括:
[0029]潮流等式约束为:
[0030][0031][0032]潮流不等式约束为:
[0033][0034][0035][0036][0037]式中,
P
l,t
表示联络线功率,
P
b,t
表示支路
b

t
时间间隔的有功功率,
V
i,t
表示节点
i

t
时间间隔的节点电压,
P
l,t
表示联络线
l

t
时间间隔的有功功率,
R
b
、X
b
分别表示支路
b
的线路电阻与电抗取值,
P
b,cap
表示支路
b
的有功功率限额,
P
tie
表示联络线的有功功率限额,
Δ
V
max
表示最大的允许电压偏移量,
V0表示标称节点电压

[0038]优选地,根据所述需求响应的调控收益模型将需求响应定价优化问题描述为马尔可夫决策过程的步骤,具体包括:
[0039]根据所述需求响应的调控收益模型的目标函数设置奖励函数为:
[0040][0041]式中,
R
t
为奖励值,
β
i
为第
i
个约束的权重,
c
i
为约束计算值,
c
i,max
为约束计算值的最大允许值;
[0042]马尔可夫决策本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种计及有序用电损失的需求响应定价调控方法,其特征在于,包括以下步骤:以一个运行日的最大收益为目标,设置各时段的需求响应电价定价和有序用电削减参数为状态变量,构建需求响应的调控收益模型;根据所述需求响应的调控收益模型将需求响应定价优化问题描述为马尔可夫决策过程;基于多智能体强化学习算法,将所述需求响应电价定价和所述有序用电削减参数设置为决策智能体,通过历史运行数据对所述决策智能体进行迭代训练,求解马尔可夫决策过程,得到最佳的需求响应电价定价策略和最佳的有序用电削减参数策略;通过配电网在运行日在线响应并执行所述最佳的需求响应电价定价策略和所述最佳的有序用电削减参数策略
。2.
根据权利要求1所述的一种计及有序用电损失的需求响应定价调控方法,其特征在于,以一个运行日的最大收益为目标,设置各时段的需求响应电价定价和有序用电削减参数为状态变量,构建需求响应的调控收益模型的步骤,具体包括:以一个运行日的最大收益为目标,设置各时段的需求响应电价定价和有序用电削减参数为状态变量,构建需求响应的调控收益模型的目标函数为:式中,
C
PV,t
表示新能源电源的运行费用,
C
grid,t
表示分布式电网功率平衡购电费用,
C
rev,t
表示售电盈余;其中,式中,
C
PV,OM
表示新能源电源的单位运行与维护费用,
N
PV
表示新能源电源的装配总数目,
T
表示总时间,
R
PV,n,t
表示新能源电源
n
在时间间隔
t
的发电效率,表示新能源电源
n
的额定发电功率;式中,
C
buy
表示从主电网系统购买电能量的购电价格,
C
sell
表示向主电网系统出售电能的售电价格,
P
def,t
、P
sur,t
分别表示联络线下行功率和联络线上行功率;式中,
N
D
表示负荷总数,
K
DLC,i,t
表示负荷削减率,
P
D,i,t
表示售电价格,
C
D
表示负荷侧售电电价;考虑需求响应情况下,电价
Pr
t
与需求响应后的售电价格
P
D,i,t
之间的关系式表示为:式中,表示
t
时间间隔下的功率预测值,与均为相关计算因子;确定约束条件为:
1)
参与需求响应后的负荷总量不小于需求响应前的负荷总量,其约束关系为:
2)
电网运行约束包括:等式约束为:等式约束为:潮流不等式约束为:潮流不等式约束为:潮流不等式约束为:潮流不等式约束为:式中,
P
l,t
表示联络线功率,
P
b,t
表示支路
b

t
时间间隔的有功功率,
V
i,t
表示节点
i

t
时间间隔的节点电压,
P
l,t
表示联络线
l

t
时间间隔的有功功率,
R
b
、X
b
分别表示支路
b
的线路电阻与电抗取值,
P
b,cap
表示支路
b
的有功功率限额,
P
tie
表示联络线的有功功率限额,
Δ
V
max
表示最大的允许电压偏移量,
V0表示标称节点电压
。3.
根据权利要求2所述的一种计及有序用电损失的需求响应定价调控方法,其特征在于,根据所述需求响应的调控收益模型将需求响应定价优化问题描述为马尔可夫决策过程的步骤,具体包括:根据所述需求响应的调控收益模型的目标函数设置奖励函数为:式中,
R
t
为奖励值,
β
i
为第
i
个约束的权重,
c
i
为约束计算值,
c
i,max
为约束计算值的最大允许值;马尔可夫决策过程的评价网络设置为,
Q(P
D
,K
DLC
)

E[∑
γ
t
R
t
]
式中,
P
D
为售电价格,
K
DLC
为负荷削减率,
E
为数学期望运算,
γ
t
为折扣因子
。4.
根据权利要求3所述的一种计及有序用电损失的需求响应定价调控方法,其特征在于,基于多智能体强化学习算法,将所述需求响应电价定价和所述有序用电削减参数设置为决策智能体,通过历史运行数据对所述决策智能体进行迭代训练,求解马尔可夫决策过程,得到最佳的需求响应电价定价策略和最佳的有序用电削减参数策略的步骤,具体包括:基于多智能体强化学习算法,将所述需求响应电价定价设置为一组决策智能体,所述有序用电削减参数设置为另一组决策智能体,设置评价网络以两组决策智能体的状态与动作为输入,输出为决策智能体期望值;对所述决策智能体和所述评价网络进行初始化操作,其中,所述评价网络的目标函数为:
式中,
L(
π
(P
D
,K
DLC
))
为动作策略的最小损失函数,
N
为训练的样本数,
α

λ
分别为优化目标熵项的温度系数和强化学习的学习率;获取配电网的历史运行数据,所述历史运行数据包括负荷预测值

新能源发电功率预测值

售电价格

实时负荷量测值

新能源功率量测值和负荷削减率;对所述历史运行数据进行归一化,构建训练样本集;通过所述训练样本集对评价网络的目标函数进行迭代计算,直至迭代次数达到预设最大迭代次数,迭代停止并输出对应的动作策略的最小损失函数,对所述最小损失函数进行微分求解,得到动作策略,所述动作策略包括最佳的需求响应电价定价策略和最佳的有序用电削减参数策略
。5.
一种计及有序用电损失的需求响应定价调控系统,其特征在于,包括:需求响应构建模块,用于以一个运行日的最大收益为目标,设置各时段的需求响应电价定价和有序用电削减参数为状态变量,构建需求响应的调控收益模型;马尔可夫决策模块,用于根据所述需求响应的调控...

【专利技术属性】
技术研发人员:胡春潮张延旭蔡煜曾梦迪沈开慧
申请(专利权)人:南方电网电力科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1