基于物理模型与价值神经网络融合的经济调度决策方法技术

技术编号:41232920 阅读:32 留言:0更新日期:2024-05-09 23:48
本发明专利技术属于电力系统自动化技术领域,本发明专利技术提供了基于物理模型与价值神经网络融合的经济调度决策方法,首先,将电网经济调度的数学模型转换成受限马尔可夫决策过程模型,其次,基于动作空间的映射和松弛原理,将受限马尔可夫决策过程模型无约束马尔可夫决策过程模型,其中,所述无约束马尔可夫决策过程模型采用深度确定性策略梯度算法对深度强化学习智能体进行训练,得到所述电网经济调度的策略神经网络和价值神经网络,最后,以所述价值神经网络最高估值为指导,利用所述策略神经网络输出所述电网经济调度的最优策略,实现所述电网经济调度。本发明专利技术能够快速、准确地训练出电网经济调度智能体,生成满足电网安全稳定运行要求的有功调度策略。

【技术实现步骤摘要】

本申请涉及电力系统自动化,特别涉及一种基于物理模型与价值神经网络融合的经济调度决策方法


技术介绍

1、随着新型电力系统的发展,大规模常规机组被新能源机组替代,直流远距离输电规模持续增长,电网形态及运行特性发生显著变化,主要体现在电网调节能力严重下降、电网抗扰动能力不足、电网安全稳定问题耦合交织等方面,系统安全稳定运行面临的压力日益增长。此外,电动汽车、储能设备和综合能源系统等具备源荷双重特征的新型负荷比重不断上升,大量的电力负荷通过负荷聚合商、虚拟电厂等不同方式参与电网调控,进一步加剧了调度运行控制的复杂程度。

2、而现有的技术中,例如申请号为cn202211470739.x提出了一种基于安全强化学习的主动配电网实时调度方法及装置,可在缺少主动配电网模型的情况下最大化主动配电网运行的经济性,同时满足主动配电网的安全约束,提升主动配电网运行的安全性。但上述专利未能考虑新能源不确定性带来的电网运行成本波动。且申请号为cn202111641984.8提出了一种输电网的过载动态决策生成方法及相关装置,解决现有技术没有充分考虑新形态电力系统特点、缺乏针本文档来自技高网...

【技术保护点】

1.一种基于物理模型与价值神经网络融合的经济调度决策方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于物理模型与价值神经网络融合的经济调度决策方法,其特征在于,所述电网经济调度的数学模型,还包括:目标函数;其中,

3.根据权利要求2所述的一种基于物理模型与价值神经网络融合的经济调度决策方法,其特征在于,所述电网经济调度的数学模型,还包括:约束条件;其中,

4.根据权利要求3所述的一种基于物理模型与价值神经网络融合的经济调度决策方法,其特征在于,所述受限马尔可夫决策过程模型,包括:状态,当前时刻的观测信息;具体包括:当前时刻的常规机组有功...

【技术特征摘要】

1.一种基于物理模型与价值神经网络融合的经济调度决策方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于物理模型与价值神经网络融合的经济调度决策方法,其特征在于,所述电网经济调度的数学模型,还包括:目标函数;其中,

3.根据权利要求2所述的一种基于物理模型与价值神经网络融合的经济调度决策方法,其特征在于,所述电网经济调度的数学模型,还包括:约束条件;其中,

4.根据权利要求3所述的一种基于物理模型与价值神经网络融合的经济调度决策方法,其特征在于,所述受限马尔可夫决策过程模型,包括:状态,当前时刻的观测信息;具体包括:当前时刻的常规机组有功功率ptg、无功功率机端电压幅值新能源机组有功功率ptng、无功功率机端电压幅值负荷有功功率ptload、无功功率电压幅值交流线路潮流ptac,下一时刻的新能源出力预测最大值最终的状态空间如下:

5.根据权利要求4所述的一种基于物理模型与价值神经网络融合的经济调度决策方法,其特征在于,所述受限马尔可夫决策过程模型,还包括:动作,以tanh函数作为智能体的输出层激活函数;智能体的输出分布区间为[-1,1]...

【专利技术属性】
技术研发人员:王淼李立新李理吕闫孙博石上丘孙略於益军罗雅迪张印田曦晨郎燕生马晓忱王少芳曾沅任郡枝胡雨卓曹皓森
申请(专利权)人:中国电力科学研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1