【技术实现步骤摘要】
一种综合能源系统优化调度方法、系统、设备及介质
[0001]本专利技术属于电力调度决策
,特别涉及一种综合能源系统优化调度方法、系统、设备及介质。
技术介绍
[0002]在扩大能源需求与降低碳排放的压力下,构建完善的综合能源系统是促进能源转型的重要途径;通过构建完善的综合能源系统能够消纳新能源、优化能源供应结构以及提高能源的利用效率。
[0003]综合能能源系统需要同时考虑多个相互耦合的异质能源网络和设备,来满足用户侧的电、热、冷等的用能需求,另外,随机出力的高渗透新能源注入导致系统结构更加复杂,难以收集系统运行参数;综合能源系统对机组出力的准确性和实时性要求更高,不准确的系统参数和快速变化的实时数据很容易导致更新不及时,会影响机组的输出优化精度,降低结果的可靠性。
[0004]基于上述陈述可知,如何优化单元出力来降低系统运行成本成为了综合能源系统研究中重要问题;现有的综合能源系统机组优化出力的准确性和及时性存在不足,亟需一种新的综合能源优化调度方法。
技术实现思路
[0005]本专利技 ...
【技术保护点】
【技术特征摘要】
1.一种综合能源系统优化调度方法,其特征在于,包括以下步骤:接收到调度任务时,基于预先构建并训练好的综合能源系统数字孪生模型获取综合能源系统当前t时刻的状态S
t
;所述综合能源系统数字孪生模型包括决策层;采用所述决策层中部署的预先训练好的DDPG算法,基于所述当前t时刻的状态S
t
,确定动作a
t
;基于所述综合能源系统数字孪生模型,执行动作a
t
并获得t+1时刻的状态S
t+1
;基于获得的t+1时刻的状态S
t+1
和所述DDPG算法,通过选择t+1时刻的动作a
t+1
获得动态调度动作,并基于所述动态调度动作调节所述综合能源系统包括的机组输出量。2.根据权利要求1所述的一种综合能源系统优化调度方法,其特征在于,所述预先构建的综合能源系统数字孪生模型的获取步骤包括:搭建综合能源系统物理实体,构建获得物理层;在所述综合能源系统物理实体的预设位置安装多维传感器,构建获得感知层;构建数据传输层;其中,所述数据传输层用于存储或传输所述感知层获取的数据;构建数据处理层;其中,所述数据处理层用于接收所述数据传输层输送的数据并进行预处理,基于预处理后的数据构建综合能源系统的数字孪生环境;用于将综合能源系统的每一种类型的单元作为一个智能体,实现智能体与数字孪生环境之间的持续交互;用于采用历史数据对决策层产生的预测结果进行校正;搭建综合能源系统虚拟实体,构建获得决策层;其中,所述决策层用于基于智能体和数字孪生环境之间的交互数据,使用预先训练好的DDPG算法寻找机组单元经济运行输出的最佳策略,生成单元输出调度计划;基于所述物理层、感知层、数据传输层、数据处理层和决策层得到综合能源系统数字孪生模型。3.根据权利要求2所述的一种综合能源系统优化调度方法,其特征在于,所述数字孪生环境包括综合能源系统内功率平衡约束和各机组单元运行范围约束;内功率平衡约束包括电功率和热功率平衡约束,表达式为,P
grid
(t)+P
RG
(t)+P
BES
(t)+P
CHP
(t)
‑
P
EB
(t)=P
load
(t);H
CHP
(t)+H
GB
(t)+H
EB
(t)=H
load
(t);式中,P
grid
(t)、P
RG
(t)、P
BES
(t)、P
CHP
(t)、P
EB
(t)、P
load
(t)分别为在t时间段内,与主网侧的交互功率、可再生能源机组输出电功率、电储能的充电功率或放电功率、热电联供机组的输出电功率、电锅炉的输入电功率及用户电负荷;H
CHP
(t)、H
GB
(t)、H
EB
(t)、H
load
(t)分别为热电联供机组的输出热功率、燃气锅炉的输出热功率、电锅炉的输出热功率和用户热负荷;各机组单元运行范围约束,表达式为,
式中,分别为综合能源系统与主网侧交互功率的下限和上限;分别为热电联供机组的输出电功率的下限和上限;分别为电储能的充/放电功率的下限和上限;分别为燃气锅炉的输出热功率的下限和上限;分别为电锅炉的输出热功率的下限和上限;分别为电储能荷电状态的下限和上限。4.根据权利要求3所述的一种综合能源系统优化调度方法,其特征在于,所述预先训练好的DDPG算法的获取步骤包括:构建综合能源系统深度强化学习框架中的状态空间、动作空间和奖励函数;所述状态空间的表达式为,S
t
={P
load
(t),H
load
(t),P
RG
(t),C
SOC
(t
‑
1),t};式中,C
SOC
(t
‑
1)为电储能荷电状态;所述动作空间表达式为,a
t
={P
CHP
(t),P
BES
(t),H
GB
(t)};所述奖励函数表达式为,式中,能源购买成本C
E
,折旧成本C
BES
;式中,ε
e
(t)为t时间段内的电价,ε
gas
(t)为时段t购买天然气的单位热值价格,为热电联供机组的电效率,η
GB
为燃气锅炉的效率,T为总调度时间,
△
t为时隙长度,ρ
BES
为电储能折旧成本系数;当综合能源系统中系统状态S
t
确定,调度动作a
t
的优劣程度采用动作价值函数Q
π
(S,a)评估,直至找到最优策略π*以最大化Q
π
(S,a);其中,所述动作价值函数Q
π
(S,a)的表达式为,式中,E
π
(.)为策略π下的期望,γ为折扣因子;分别采用值网络θ
Q
和策略网络θ
π
来逼近DDPG算法框架中的critic和actor函数,值网络θ
Q
和策略网络θ
π
为两个独立的网络,两个网络均有各自的目标网络θ
Q
‘
和θ
π
’
;其中,在t时刻的迭代计算中,策略网络θ
Q
输入状态空间中的状态S
t
,输出动作空间中的动作a
t
;智能体根
据t时刻的控制策略进行状态转移,获得下一时刻的状态S
t+1
,并给出t时刻的奖励r
t
(S
t
,a
t
)反馈给智能体,智能体记录经验e
t
=(S
t
,a
t
,r
t
(S
t
,a
t
),S
t+1
)并将其放入经验池;值网络θ
π
输入状态空间中的状态S
t
和动作空间中的动作a
t
,输出动作
‑
值函数Q
π
(S
t
,a
t
);训练时重复迭代,每次从经验池中随机提取小批量样本,θ
Q
和θ
π
网络通过梯度下降法更新网络参数直至稳定,获得所述预先训练好的DDPG算法。5.一种综合能源系统优化调度系统,其特征在于,包括:第一状态获取模块,用于接收到调度任务时,基于预先构建并训练好的综合能源系统数字孪生模型获取综合能源系统当前t时刻的状态S
t
;所述综合能源系统数字孪生模型包括决策层;第一动作获取...
【专利技术属性】
技术研发人员:王新迎,张彬文,李烨,闫冬,王天昊,
申请(专利权)人:国网天津市电力公司国家电网有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。