数模联合驱动的图深度强化学习电力系统优化调度方法技术方案

技术编号:42502009 阅读:23 留言:0更新日期:2024-08-22 14:15
本发明专利技术提供一种数模联合驱动的图深度强化学习电力系统优化调度方法,包括:分别构建电力系统源网荷储协同优化调度模型与电力系统优化调度决策的图神经网络模型;根据上述模型进行马尔科夫模型重构,得到组成图深度强化学习电力系统优化调度的决策智能体的状态空间、动作空间和奖励函数;基于电力系统源网荷储协同优化调度模型的目标函数和约束条件进行调整,得到决策智能体的决策动作安全动作映射及后处理方法;根据最大化所述奖励函数的奖励值为目标对初始决策智能体进行离线训练,得到调度决策智能体;通过调度决策智能体进行电力系统优化调度的在线决策。本发明专利技术的方法提高了调度决策的效率和安全性,促进了可再生能源消纳。

【技术实现步骤摘要】

本专利技术涉及电力系统调度,尤其涉及一种数模联合驱动的图深度强化学习电力系统优化调度方法


技术介绍

1、能源短缺、环境污染和气候变化等问题正在推动着现代电力系统迅速向可再生能源转型,然而,可再生能源固有的不确定性和间歇性给电力系统调度带来了巨大挑战。传统的电力系统优化调度方法难以在确保电力系统安全经济运行的同时最大程度的消纳可再生能源,因此,迫切需要一种高效且可靠的调度方法,以应对高渗透可再生能源电力系统中的时变不确定性场景。

2、随着人工智能技术基础理论的不断完善和计算机硬件运算能力的提升,机器学习方法以其强大的特征提取和快速的映射求解能力,为解决电力系统优化调度问题提供了更为先进和有效的工具。深度强化学习方法由于其能够通过与不确定且动态的电力系统运行环境互动来训练调度决策代理学习最优策略,在电力系统调度问题中取得了广泛关注和应用。

3、然而,传统的深度强化学习方法通常难以执行电力系统调度问题中的诸多约束,从而导致其探索和学习的效率降低;并且在决策阶段应对训练过程中很少或从未发生的场景时可能产生无效或不可行的调度决策结果,从而对本文档来自技高网...

【技术保护点】

1.一种数模联合驱动的图深度强化学习电力系统优化调度方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述电力系统源网荷储协同优化调度模型的目标函数包括火电机组发电成本、储能装置与可调负荷调节成本以及可再生能源消纳量;

3.根据权利要求1所述的方法,其特征在于,所述基于所述电力系统的拓扑结构和节点信息之间的关系,建立电力系统优化调度决策的图神经网络模型,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述电力系统源网荷储协同优化调度模型和所述电力系统优化调度决策的图神经网络模型进行马尔可夫模型重构,得到组成图深度强化学习电力...

【技术特征摘要】

1.一种数模联合驱动的图深度强化学习电力系统优化调度方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述电力系统源网荷储协同优化调度模型的目标函数包括火电机组发电成本、储能装置与可调负荷调节成本以及可再生能源消纳量;

3.根据权利要求1所述的方法,其特征在于,所述基于所述电力系统的拓扑结构和节点信息之间的关系,建立电力系统优化调度决策的图神经网络模型,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述电力系统源网荷储协同优化调度模型和所述电力系统优化调度决策的图神经网络模型进行马尔可夫模型重构,得到组成图深度强化学习电力系统优化调度的决策智能体的状态空间、动作空间和奖励函数,包括:

5.根据权利要求1所述的方法,其特征在于,所述基于所述电力系统源网荷储协同优化调度模型的目标函数和约束条件进行调整,得到所述决策智能体的决策动作安全动作映射及后处理方法,包括:

6.根据权利要求5所述的方法,其特征在于,所述后处理方法包括:

7.根据权利要求1所述的方法,其特征在于,所述根据最大化所述奖励函数的奖励值为目标对所述决策智能体进行离线训练,得到调度决策智能体,包括:

8.根据权利要求1所述的方法,其特征在于,所述进行电力系统优化调度的在线决策,包括:

9.一种数模联合驱动的图深度强化学习电力系统优化调度装置,其特征在于,包括:

10.根据权利要求9所述的装置,其特征在于,所述电力系统源网荷储协同优化调度模型的...

【专利技术属性】
技术研发人员:丁涛杜思君万婧瑀蒙飞祁鑫刘一峰王运孙阳常鹏杨宏刘俊潘玲玲孙知博耿建
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1