一种电网在线调度系统、方法和存储介质技术方案

技术编号:40195413 阅读:28 留言:0更新日期:2024-01-26 23:58
本发明专利技术涉及一种电网在线调度系统、方法和存储介质,系统中,混合动作空间统一映射模块将混合决策空间映射到离散动作空间,仿真采样模块执行蒙特卡洛树搜索并与电网仿真环境进行交互收集数据,数据存储模块存储采样数据,策略优化模块读取数据进行学习;之后使用经过训练阶段的调度系统进行电网在线调度。与现有技术相比,本发明专利技术具有通过深度神经网络的自适应学习和大规模的仿真模拟探索电网系统的调度策略,避免了对领域知识的依赖;通过大量积累的统计信息进行决策,可以为高度随机性事件提供有效的解决方案;将混合的决策空间统一映射到离散决策空间,实现了同时针对离散和连续的调节任务做出有效决策等优点。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其是涉及一种电网在线调度系统、方法和存储介质


技术介绍

1、电网是一个将电力从生产商(发电站)输送到消费者(楼房、工厂等)的互连系统。电网系统的稳定运行是一个动态平衡的过程,需要熟练的专家进行不间断的监测,并经常进行干预,以安全可靠地将电力从生产商输送到所有连接的消费者,以及避免电力系统的失衡造成停电事件引发甚至安全事故,对社会经济和公共安全造成严重影响。

2、现有的电网系统调度方法主要有基于专家经验的人工调控方法,基于数学模型的建立和求解方法,以及传统的深度强化学习方法。然而现有的电网系统调度决策方法存在如下缺陷和不足:第一,依赖专家经验和领域知识,无论是人工调节方法还是建立数学模型的方法,都高度依赖领域知识,这增加了新型方法和模型的引入成本;第二,难以适应高度的随机性和不确定性,电力设备尤其是新能源设备的发电功率极大程度地受到天气、气候等外部因素的影响,再加之设备故障,灾祸事故以及需求的剧烈变化,电力系统存在高度的随机性和不确定性,而现有的电网调度方法往往难以为这种高度随机性提供有效的解决方案;第三,复杂的混合决本文档来自技高网...

【技术保护点】

1.一种电网在线调度系统,其特征在于,包括混合动作空间统一映射模块、仿真采样模块、数据存储模块和策略优化模块,所述调度系统具有训练阶段和运行阶段,所述训练阶段中,所述混合动作空间统一映射模块将混合决策空间映射到离散动作空间,所述仿真采样模块执行蒙特卡洛树搜索并与电网仿真环境进行交互收集数据,所述数据存储模块存储采样数据,所述策略优化模块读取数据进行学习;所述运行阶段中,使用经过训练阶段的调度系统进行电网在线调度。

2.根据权利要求1所述的一种电网在线调度系统,其特征在于,所述的电网在线调度包括拓扑结构的调整和发电站功率的调整,所述拓扑结构的调整包括调整各变电站中不同支线和母线...

【技术特征摘要】

1.一种电网在线调度系统,其特征在于,包括混合动作空间统一映射模块、仿真采样模块、数据存储模块和策略优化模块,所述调度系统具有训练阶段和运行阶段,所述训练阶段中,所述混合动作空间统一映射模块将混合决策空间映射到离散动作空间,所述仿真采样模块执行蒙特卡洛树搜索并与电网仿真环境进行交互收集数据,所述数据存储模块存储采样数据,所述策略优化模块读取数据进行学习;所述运行阶段中,使用经过训练阶段的调度系统进行电网在线调度。

2.根据权利要求1所述的一种电网在线调度系统,其特征在于,所述的电网在线调度包括拓扑结构的调整和发电站功率的调整,所述拓扑结构的调整包括调整各变电站中不同支线和母线的连接方式;所述发电站功率的调整包括对电网系统中发电机组功率调节。

3.根据权利要求2所述的一种电网在线调度系统,其特征在于,所述的混合动作空间统一映射模块对发电机组功率调节的连续动作空间进行映射,映射后电网调度的决策动作统一表述。

4.根据权利要求2所述的一种电网在线调度系统,其特征在于,所述的仿真采样模块通过多线程并行的方式实现电网系统仿真模拟和训练数据收集采样;所述多线程中的每个子线程pi独立维护自身的决策树ti、策略网络πi、价值网络vi以及电网仿真环境ei,独立执行树搜索过程和与电网仿真环境的...

【专利技术属性】
技术研发人员:赵莹莹李凡苏运吴裔郭乃网陈宏福高峰郑成张梦圆田英杰
申请(专利权)人:国网上海市电力公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1