一种需求响应下的综合能源系统能量管理方法技术方案

技术编号:38675252 阅读:16 留言:0更新日期:2023-09-02 22:51
本发明专利技术属于能量管理技术领域,提出了一种需求响应下的综合能源系统能量管理方法,包括以下步骤:步骤1:建立综合能源系统能量设备模型、用户用能行为模型及其运行优化模型;步骤2:构建TD3所需的神经网络;步骤3:根据步骤1建立的模型,利用能量管理中心与综合能源系统进行交互并将交互所得的历史信息放入经验池,同时利用TD3实现策略网络与值网络的优化;步骤4:根据步骤3获得的优化后的策略网络来对综合能源系统进行控制使其能够参与到电力需求响应中去。本发明专利技术有助于综合能源系统合理安排内部能量设备的生产计划和内部用户的用能计划,进一步提高系统的需求响应潜力,在完成电网需求响应计划的同时维持综合能源系统的安全稳定与经济运行。定与经济运行。定与经济运行。

【技术实现步骤摘要】
一种需求响应下的综合能源系统能量管理方法


[0001]本专利技术属于能量管理
,更具体地,涉及一种需求响应下的综合能源系统能量管理方法。

技术介绍

[0002]当今世界各地环境污染与能源短缺问题日益严重,人们迫切需要提高能源的利用效率。综合能源系统以多能耦合生产为基础、多种能源网络协同为调度核心,打破了各能源分开规划、独立运行的既有模式,能够实现多种能源的协同优化互济。电力需求响应是实施电力需求管理的重要方式,其主要通过电能电价、政策激励等方式引导用户调整自身的用电行为,可以有效缓解电力供应紧张的现象,提高电网运行的安全性和稳定性。随着广东、安徽等省份电力需求政策的逐步实施,综合能源系统也能够参与到电力需求响应中去,其可以通过调整自身的能量生产计划等方式改变对电网的能量需求,具有极大的需求响应调节潜力。
[0003]针对综合能源系统优化调度问题的求解,主要包括非线性方法求解、智能算法求解以及线性简化求解三方面的求解思路。前两种方法在电、热、冷耦合越来越密切的高维非线性问题的求解中,运算时间过长,难以满足在线计算的要求,线性化处理虽然易于计算和求解,但不可避免会出现求解结果误差较大的情况。随着人工智能技术的兴起和发展,深度强化学习在综合能源系统的优化控制中愈加受到重视。深度强化学习具备强大的自主学习能力,能够从海量历史数据中获取历史经验,智能体能够在不同的系统状态下采取不同的动作,并从奖励回报中学习知识以获得最优策略,智能体在与环境交互的整个过程可以不依赖详细精确的模型信息,相对于传统方法在实际的调度场景下更加容易实现,同时利用离线学习、在线决策的方式可以实现系统实时运行决策。

技术实现思路

[0004]针对目前综合能源系统能量管理在现有技术中存在的问题,本专利技术提出一种需求响应下的综合能源系统能量管理方法,该方法能够实现对综合能源系统参与电力需求响应时在多种随机因素影响下的安全稳定与经济运行。
[0005]为实现上述目的,本专利技术采用如下技术方案:
[0006]一种需求响应下的综合能源系统能量管理方法,包括综合能源系统,上述综合能源系统包括能量管理中心(EMS)、能量转换设备、能量储存设备以及多类用户,上述能量转换设备包括燃气轮机(GT)、余热锅炉(HB)、燃气锅炉(GB)、吸收式制冷机(AR)、电热泵(EB)、电制冷机组(ER)和光伏发电装置(PV),上述能量储存设备包括蓄电池(ES)和储热罐(HS),上述多类用户包括公共服务用户和商业用户,用户的负荷有电负荷、热负荷和冷负荷三种能量形式,上述能量管理中心是能量与信息的整合中心,对外承接电力供应商和天然气供应商,可以获取电度电价、天然气价格以及电力公司发布的需求响应计划等信息,控制电能与天然气能的购买量,对内可向多类用户发布响应邀约以调整用户固有用能行为及控制系
统内能量设备的生产计划,以此参与并完成电力公司的电力需求响应,同时兼顾系统运行的安全性、经济性,其特征在于,能量管理方法具体包括如下步骤:
[0007]步骤1:综合能源系统参与电力需求响应是以一天为一个调度周期,其优化运行的总目标是在完成电力需求响应目标的基础上,使系统运行一天的总利润最大,因此,需要建立综合能源系统参与电力需求响应的运行优化模型:
[0008]步骤1.1、建立电力需求响应计划、光伏出力随机性、室外温度随机性、以及用户电热冷负荷随机性模型;
[0009]步骤1.2、建立综合能源系统能量转化设备与能量存储设备调度模型;
[0010]步骤1.3、建立综合能源系统内部多类用户响应特性模型;
[0011]步骤1.4、建立综合能源系统参与电力需求响应的调度优化模型;
[0012]步骤2:构建双延迟深度确定性策略梯度算法(Twin Delayed Deep Deterministic Policy Gradient Algorithm,TD3)所需的深度神经网络:
[0013]TD3拥有三个独立的神经网络,分别为策略网络、值网络1与值网络2,每个网络均有各自的目标网络,分别为目标策略网络、目标值网络1与目标值网络2,上述六个神经网络均为全连接神经网络,包括输入层、隐藏层和输出层,其中策略网络和目标策略网络结构相同,值网络1、值网络2、目标值网络1与目标值网络2结构相同;
[0014]步骤3:根据步骤1建立的模型,利用能量管理中心与综合能能源系统进行交互,获得历史交互信息并将其存入经验池,利用TD3实现对策略网络、值网络1与值网络2的迭代更新与优化;
[0015]步骤4:根据步骤3所得的策略网络实现对综合能源系统的控制:
[0016]利用上述建立的综合能源系统验证验证算法的可行性,在系统运行的任意一个决策时刻,将决策时刻、邀约响应量以及综合能源系统的运行状态等信息经过归一化后输入TD3的策略网络,经过前向传播以后再将策略网络输出的动作信息进行反归一化即可得到当前决策时刻系统可采取的动作,观察综合能源系统在一个调度周期内重复执行上述操作后系统电力需求响应完成情况及其所获得的售能收益、响应收益、购能成本、激励成本、维护费成本以及碳税成本。
[0017]进一步地,所述的一种需求响应下的综合能源系统能量管理方法,其特征在于,步骤1.1所述的电力需求响应计划、光伏出力随机性、室外温度随机性、以及用户电热冷负荷随机性模型,具体步骤为:
[0018]确定参与电力需求响应的应约响应量:
[0019]确定综合能源系统在一个调度周期内各个决策时刻t
k
的电力需求响应的应约响应量P

peak
(t
k
),得到在一个调度周期内各决策时刻综合能源系统的需求响应目标:
[0020]{P

peak
(t1),P

peak
(t1),...,P

peak
(t
k
),...,P

peak
(t
K
)}
[0021]光伏出力随机性:
[0022]光伏出力的误差ΔP
pv
服从均值为μ
pv
方差为σ
pv
的正态分布,即ΔP
pv
~N(μ
pv

pv2
),其概率密度函数可表示为:
[0023][0024]若决策时刻t
k
光伏出力的预测值为P
pv,0
(t
k
),叠加随机误差后可得光伏出力的实际值P
pv
(t
k
)为:
[0025]P
pv
(t
k
)=P
pv,0
(t
k
)+ΔP
pv
[0026]温度随机性:
[0027]温度的误差ΔT
temp
服从均值为μ
te本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种需求响应下的综合能源系统能量管理方法,包括综合能源系统,所述综合能源系统包括能量管理中心、能量转换设备、能量储存设备以及多类用户,所述能量转换设备包括燃气轮机、余热锅炉、燃气锅炉、吸收式制冷机、电热泵、电制冷机组和光伏发电装置,所述能量储存设备包括蓄电池和储热罐,所述多类用户包括公共服务用户和商业用户,用户的负荷有电负荷、热负荷和冷负荷三种能量形式,所述能量管理中心是能量与信息的整合中心,对外承接电力供应商和天然气供应商,可以获取电度电价、天然气价格以及电力公司发布的需求响应计划等信息,控制电能与天然气能的购买量,对内可向多类用户发布响应邀约以调整用户固有用能行为及控制系统内能量设备的生产计划,其特征在于,所述能量管理方法具体包括如下步骤:步骤1:综合能源系统参与电力需求响应是以一天为一个调度周期,其优化运行的总目标是在完成电力需求响应目标的基础上,使系统运行一天的总利润最大,建立综合能源系统参与电力需求响应的运行优化模型:步骤1.1、建立电力需求响应计划、光伏出力随机性、室外温度随机性、以及用户电热冷负荷随机性模型;步骤1.2、建立综合能源系统能量转化设备与能量存储设备调度模型;步骤1.3、建立综合能源系统内部多类用户响应特性模型;步骤1.4、建立综合能源系统参与电力需求响应的调度优化模型;步骤2:构建双延迟深度确定性策略梯度算法所需的深度神经网络:双延迟深度确定性策略梯度算法拥有三个独立的神经网络,分别为策略网络、值网络1与值网络2,每个网络均有各自的目标网络,分别为目标策略网络、目标值网络1与目标值网络2,所述述六个神经网络均为全连接神经网络,包括输入层、隐藏层和输出层,其中策略网络和目标策略网络结构相同,值网络1、值网络2、目标值网络1与目标值网络2结构相同;步骤3:根据步骤1建立的模型,利用能量管理中心与综合能能源系统进行交互,获得历史交互信息并将其存入经验池,利用TD3实现对策略网络、值网络1与值网络2的迭代更新与优化;步骤4:根据步骤3所得的策略网络实现对综合能源系统的控制:在系统运行的任意一个决策时刻,将决策时刻、邀约响应量以及综合能源系统的运行状态等信息经过归一化后输入双延迟深度确定性策略梯度算法的策略网络,经过前向传播以后再将策略网络输出的动作信息进行反归一化即可得到当前决策时刻系统可采取的动作,观察综合能源系统在一个调度周期内重复执行上述操作后系统电力需求响应完成情况及其所获得的售能收益、响应收益、购能成本、激励成本、维护费成本以及碳税成本。2.根据权利要求1所述的需求响应下的综合能源系统能量管理方法,其特征在于,所述步骤1.1所述的电力需求响应计划、光伏出力随机性、室外温度随机性、以及用户电热冷负荷随机性模型,具体步骤为:确定参与电力需求响应的应约响应量:确定综合能源系统在一个调度周期内各个决策时刻t
k
的电力需求响应的应约响应量P

peak
(t
k
),得到在一个调度周期内各决策时刻综合能源系统的需求响应目标:{P

peak
(t1),P

peak
(t1),...,P

peak
(t
k
),...,P

peak
(t
K
)}光伏出力随机性:
光伏出力的误差ΔP
pv
服从均值为μ
pv
方差为σ
pv
的正态分布,即ΔP
pv
~N(μ
pv

pv2
),其概率密度函数可表示为:若决策时刻t
k
光伏出力的预测值为P
pv,0
(t
k
),叠加随机误差后可得光伏出力的实际值P
pv
(t
k
)为:P
pv
(t
k
)=P
pv,0
(t
k
)+ΔP
pv
温度随机性:温度的误差ΔT
temp
服从均值为μ
temp
方差为σ
temp
的正态分布,即ΔT
temp
~N(μ
temp

temp2
),其概率密度函数可表示为:若决策时刻t
k
温度的预测值为T
temp,0
(t
k
),叠加随机误差后可得温度的实际值T
temp
(t
k
)为:T
temp
(t
k
)=T
temp,0
(t
k
)+ΔT
temp
电负荷随机性:电负荷的误差ΔL
ele
服从均值为μ
ele
方差为σ
ele
的正态分布,即ΔL
ele
~N(μ
ele

ele2
),其概率密度函数可表示为:若决策时刻t
k
电负荷的预测值为L
ele,0
(t
k
),叠加随机误差后可得电负荷的实际值L
ele
(t
k
)为:L
ele
(t
k
)=L
ele,0
(t
k
)+ΔL
ele
热负荷随机性:热负荷的误差ΔL
hot
服从均值为μ
hot
方差为σ
hot
的正态分布,即ΔL
hot
~N(μ
hot

hot2
),其概率密度函数可表示为:若决策时刻t
k
热负荷的预测值为L
hot,0
(t
k
),叠加随机误差后可得热负荷的实际值L
hot
(t
k
)为:L
hot
(t
k
)=L
hot,0
(t
k
)+ΔL
hot
冷负荷随机性:冷负荷的误差ΔL
cold
服从均值为μ
cold
方差为σ
cold
的正态分布,即ΔL
cold
~N(μ
cold

cold2
),其概率密度函数可表示为:
若决策时刻t
k
冷负荷的预测值为L
cold,0
(t
k
),叠加随机误差后可得冷负荷的实际值L
cold
(t
k
)为:L
cold
(t
k
)=L
cold,0
(t
k
)+ΔL
cold
3.根据权利要求2所述的需求响应下的综合能源系统能量管理方法,其特征在于,所述步骤1.2的综合能源系统能量转化设备与能量存储设备调度模型,具体步骤为:燃气轮机调度过程:燃气轮机通过消耗天然气来提供电能和热能,决策时刻t
k
燃气轮机输出的电功率计算如下:P
gt
(t
k
)=V
gt
(t
k
)H
ng
η
gt
其中,P
gt
(t
k
)和V
gt
(t
k
)为决策时刻t
k
燃气轮机输出的电功率和消耗的天然气;H
ng
为天然气热值;η
gt
为燃气轮机的发电效率;燃气轮机输出热功率与电功率的比值为热电比b,可表示为:其中,Q
gt
(t
k
)为决策时刻t
k
燃气轮机的发热功率;余热锅炉调度过程:余热锅炉可以提高能源的利用效率够,通过吸收燃气轮机排出高温烟气中的余热给用户提供热能,其数学模型为:Q
hb
(t
k
)=Q
hb,0
(t
k

hb
其中,Q
hb
(t
k
)和Q
hb,0
(t
k
)决策时刻t
k
余热锅炉吸收和输出的热功率;η
hb
为余热回收效率;燃气锅炉调度过程:燃气锅炉消耗天然气来提供热能,燃气锅炉在决策时刻t
k
输出的热功率计算如下:Q
gb
(t
k
)=V
gb
(t
k
)H
ng
η
gb
其中,Q
gb
(t
k
)和V
gb
(t
k
)为决策时刻t
k
燃气锅炉输出的热功率和消耗的天然气;η
gb
为燃气锅炉的产热效率;吸收式制冷机调度过程:吸收式制冷机通过吸收热功率来提供冷功率,吸收式制冷机在决策时刻t
k
输出的冷功率计算如下:H
ar
(t
k
)=Q
ar
(t
k

ar
其中,H
ar
(t
k
)和Q
ar
(t
k
)为t决策时刻t
k
吸收式制冷机输出的冷功率和吸收的热功率;η
ar
为吸收式制冷机的制冷效率;电热泵调度过程:电热泵通过消耗电能将低品位热能转换为高品位热能,在决策时刻t
k
电热泵输出的热功率计算如下:Q
eb
(t
k
)=P
eb
(t
k

eb
其中,Q
eb
(t
k
)和P
eb
(t
k
)为决策时刻t
k
电热泵输出的热功率和消耗的电功率;η
eb
为电热泵的制热效率;电制冷机组调度过程:电制冷机组通过消耗电功率来提供冷功率,决策时刻t
k
电制冷机组输出的冷功率计算如下:H
er
(t
k
)=P
er
(t
k

er
其中,H
er
(t
k
)和P
er
(t
k
)为决策时刻t
k
电制冷机组输出的冷功率和消耗的电功率;η
er
为电制冷机组的效率;光伏发电装置调度过程:光伏发电装置利用太阳能进行发电,其发电功率可以表示为:其中,P
pv
(t
k
)和G
light
(t
k
)为决策时刻t
k
光伏发电装置的发电功率和此时的光照强度;p
stc
和G
stc
为标准条件下光伏发电装置的发电功率和对应的光照强度;蓄电池调度过程:定义决策时刻t
k
蓄电池的荷电状态为SOC
es
(t
k
),其表示蓄电池剩余电量占额定容量的百分比,考虑到蓄电池的电量耗散和使用中的充放电,蓄电池的动态充放过程描述如下:SOC
es
(t
k
)=(1

σ
es
)SOC
es
(t
k

1)Δt

η
es
P
es
(t
k
)ΔtV
e...

【专利技术属性】
技术研发人员:唐昊张庆虎方道宏朱虹孟祥娟孙健
申请(专利权)人:中国能源建设集团安徽省电力设计院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1