多级电网实时调度策略调整方法、系统、设备及存储介质技术方案

技术编号:37178727 阅读:12 留言:0更新日期:2023-04-20 22:46
本发明专利技术属于电力自动化领域,公开了一种多级电网实时调度策略调整方法、系统、设备及存储介质,包括将电网按照联络线断面进行分区划分,得到若干分区;并获取各分区的可调机组调节范围及可调负荷调节范围;获取各分区的传输功率预测信息,并根据各分区的传输功率预测信息,调用预设的分区输电线路传输预测模型,得到各分区之间的预测传输功率;根据各分区的可调机组调节范围及可调负荷调节范围以及各分区之间的预测传输功率,调用预设的调度强化学习模型进行各分区实时调度策略编排,得到各分区的实时调度策略。将大规模多级电网高维动作空间进行降维调整,实现了多级电网分层多智能体实时调度快速调整,有效提高电力系统的综合调度效果。调度效果。调度效果。

【技术实现步骤摘要】
多级电网实时调度策略调整方法、系统、设备及存储介质


[0001]本专利技术属于电力自动化领域,涉及一种多级电网实时调度策略调整方法、系统、设备及存储介质。

技术介绍

[0002]目前,电网的实时计划编排基于超短期负荷预测、可调机组发电能力及电网模型等数据,在满足安全和电能质量的前提下,考虑可调机组运行约束、电网安全约束及系统功率平衡约束等约束条件,以最低的发电成本为目标,实现内未来5min~未来1h的各时段发电计划的集中优化编制。在实时调度中调度员需根据实际情况控制实时计划的执行和修改,对调度人员的经验要求很高,因此,实现实时计划跟随电网运行进行动态快速调整是十分必要的。
[0003]传统的编排算法大多采用基于确定性模型的安全约束最优潮流,按照由长及短的时间尺度以调整量最小为目标滚动更新实时计划。然而,随着电网规模扩大,源荷双侧不确定性增强,电网运行面临联络线阻塞、联络线N

1故障、源荷剧烈波动、新能源限电及线路过载保护开断等多种场景,要求实时计划编排算法具有高效的计算能力和强大的建模能力。这导致基于确定性模型的优化算法虽然已经成熟应用,但是无法考虑多重不确定性因素对电网运行的影响,效果日趋下降。基于此,近年来很多学者将人工智能技术引入电网调度领域,尤其在考虑不确定性的优化调度方面取得了不少研究成果。例如,有学者提出利用强化学习方法求解电网有功优化潮流问题,其模拟的问题是在保证电网安全运行的条件下,使得可调机组发电费用最小。还有学者提出可用于电网实时调度的电网专家策略模仿学习方法,设计了考虑电网安全运行和电力平衡控制的电网专家策略,基于SAC算法构建强化学习模型,然后利用模仿学习融合专家策略包括电网过载优化、电力不平衡优化等,最后获得可用于电网调度决策的智能体。
[0004]但是,上述通过强化学习方法进行电网调度的应用中,均在电网上构建一个智能体进行动作调整,对于百级节点电网来说具有一定的实现效果,而对于千级节点电网,其动作空间可达上千万甚至上亿维,这导致智能体的训练速度和网络构建难度剧增,难以实现潮流快速调整。

技术实现思路

[0005]本专利技术的目的在于克服上述现有技术的缺点,提供一种多级电网实时调度策略调整方法、系统、设备及存储介质。
[0006]为达到上述目的,本专利技术采用以下技术方案予以实现:
[0007]本专利技术第一方面,提供一种多级电网实时调度策略调整方法,包括:将电网按照联络线断面进行分区划分,得到若干分区;并获取各分区的可调机组调节范围及可调负荷调节范围;获取各分区的传输功率预测信息,并根据各分区的传输功率预测信息,调用预设的分区输电线路传输预测模型,得到各分区之间的预测传输功率;根据各分区的可调机组调
节范围及可调负荷调节范围以及各分区之间的预测传输功率,调用预设的调度强化学习模型进行各分区实时调度策略编排,得到各分区的实时调度策略。
[0008]可选的,所述将电网按照联络线断面进行分区划分,得到若干分区包括:获取电网内各支路的支路开断系数;按照支路开断系数由大到小的排序,将各支路依次加入至电网的联络线断面中,至基于联络线断面划分的分区数量达到预设数量,得到若干分区。
[0009]可选的,所述各分区的传输功率预测信息包括常规可调机组出力之和、新能源可调机组实际出力之和、新能源可调机组最大出力之和、负荷有功功率之和、可调机组调节裕度和可调负荷调节裕度,所述分区输电线路传输预测模型基于长短期记忆人工神经网络模型构建。
[0010]可选的,所述根据各分区的可调机组调节范围及可调负荷调节范围以及各分区之间的预测传输功率,调用预设的调度强化学习模型进行各分区实时调度策略编排,得到各分区的实时调度策略包括:各分区将分区边界等值成等值负荷,等值负荷的负荷功率为当前分区与其余分区之间的预测传输功率;根据各分区的可调机组调节范围及可调负荷调节范围,调用预设的强化学习模型以分区电力平衡为调度目标进行各分区实时调度策略编排,得到各分区内可调机组的有功调整量和可调负荷的有功调整量,作为各分区的实时调度策略。
[0011]可选的,所述调度强化学习模型基于TD3强化学习模型构建;所述调度强化学习模型的动作空间包括:可调机组的有功调整量和可调负荷的有功调整量;所述调度强化学习模型的状态空间包括:当前时段可调机组有功出力、当前时段可调负荷有功出力、可调机组有功出力调整上限和下限、可调负荷有功出力调整上限和下限、下一时段负荷有功功率预测、当前时段可调机组无功出力、当前时段可调机组所在节点电压及当前时段分区内各支路的支路电流负载率;所述调度强化学习模型的奖励反馈函数为加权叠加线路负载奖励、可调资源调度奖励和新能源消纳奖励。
[0012]可选的,所述调度强化学习模型的动作网络目标函数为TD3强化学习模型的动作网络目标函数加上电力不平衡量惩罚项

βΔP
unbalance
;其中,β为预设惩罚系数,ΔP
unbanlance
为电力不平衡量=可调机组出力之和

负荷有功功率之和

系统网损。
[0013]可选的,所述调用预设的调度强化学习模型进行各分区实时调度策略编排包括:获取当前分区的电网运行场景类型;根据当前分区的电网运行场景类型,从预设的调度强化学习模型中选取采用与当前分区的电网运行场景类型相同类型的电网运行场景的历史运行数据训练得到的调度强化学习子模型,作为目标调度强化学习子模型;调用目标调度强化学习子模型进行各分区实时调度策略编排。
[0014]可选的,所述调用预设的调度强化学习模型进行各分区实时调度策略编排时,当调度强化学习模型生成当前时段的动作后,根据当前时段的动作生成专家策略信息,并根据专家策略信息优化当前时段的动作。
[0015]可选的,所述根据当前时段的动作生成专家策略信息包括:根据当前时段的动作,得到分区电力不平衡量和分区支路越限信息;根据分区电力不平衡量,以最小化分区电力不平衡量为优化目标,按照火电可调机组、新能源可调机组和可调负荷的顺序进行出力策略的调整,得到第一优化调整信息;其中,对火电可调机组进行出力策略的调整时,基于各火电可调机组的剩余功率占比来进行电力不平衡量的分摊;根据分区支路越限信息,采用
拓扑搜索的方式获取越限支路预设范围内的可调机组,并按照消除越限的目标进行出力策略的调整,得到第二优化调整信息;将第一优化调整信息和第二优化调整信息作为专家策略信息。
[0016]本专利技术第二方面,提供一种多级电网实时调度策略调整系统,包括:分区模块,用于将电网按照联络线断面进行分区划分,得到若干分区;并获取各分区的可调机组调节范围及可调负荷调节范围;传输功率预测模块,用于获取各分区的传输功率预测信息,并根据各分区的传输功率预测信息,调用预设的分区输电线路传输预测模型,得到各分区之间的预测传输功率;策略调整模块,用于根据各分区的可调机组调节范围及可调负荷调节范围以及各分区之间的预测传输功率,调用预设的调度强化学习模型进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多级电网实时调度策略调整方法,其特征在于,包括:将电网按照联络线断面进行分区划分,得到若干分区;并获取各分区的可调机组调节范围及可调负荷调节范围;获取各分区的传输功率预测信息,并根据各分区的传输功率预测信息,调用预设的分区输电线路传输预测模型,得到各分区之间的预测传输功率;根据各分区的可调机组调节范围及可调负荷调节范围以及各分区之间的预测传输功率,调用预设的调度强化学习模型进行各分区实时调度策略编排,得到各分区的实时调度策略。2.根据权利要求1所述的多级电网实时调度策略调整方法,其特征在于,所述将电网按照联络线断面进行分区划分,得到若干分区包括:获取电网内各支路的支路开断系数;按照支路开断系数由大到小的排序,将各支路依次加入至电网的联络线断面中,至基于联络线断面划分的分区数量达到预设数量,得到若干分区。3.根据权利要求1所述的多级电网实时调度策略调整方法,其特征在于,所述各分区的传输功率预测信息包括常规可调机组出力之和、新能源可调机组实际出力之和、新能源可调机组最大出力之和、负荷有功功率之和、可调机组调节裕度和可调负荷调节裕度,所述分区输电线路传输预测模型基于长短期记忆人工神经网络模型构建。4.根据权利要求1所述的多级电网实时调度策略调整方法,其特征在于,所述根据各分区的可调机组调节范围及可调负荷调节范围以及各分区之间的预测传输功率,调用预设的调度强化学习模型进行各分区实时调度策略编排,得到各分区的实时调度策略包括:各分区将分区边界等值成等值负荷,等值负荷的负荷功率为当前分区与其余分区之间的预测传输功率;根据各分区的可调机组调节范围及可调负荷调节范围,调用预设的强化学习模型以分区电力平衡为调度目标进行各分区实时调度策略编排,得到各分区内可调机组的有功调整量和可调负荷的有功调整量,作为各分区的实时调度策略。5.根据权利要求1所述的多级电网实时调度策略调整方法,其特征在于,所述调度强化学习模型基于TD3强化学习模型构建;所述调度强化学习模型的动作空间包括:可调机组的有功调整量和可调负荷的有功调整量;所述调度强化学习模型的状态空间包括:当前时段可调机组有功出力、当前时段可调负荷有功出力、可调机组有功出力调整上限和下限、可调负荷有功出力调整上限和下限、下一时段负荷有功功率预测、当前时段可调机组无功出力、当前时段可调机组所在节点电压及当前时段分区内各支路的支路电流负载率;所述调度强化学习模型的奖励反馈函数为加权叠加线路负载奖励、可调资源调度奖励和新能源消纳奖励。6.根据权利要求5所述的多级电网实时调度策略调整方法,其特征在于,所述调度强化学习模型的动作网络目标函数为TD3强化学习模型的动作网络目标函数加上电力不平衡量惩罚项

βΔP
unbalance
;其中,β为预设惩罚系数,ΔP
unbanlance
为电力不平衡量=可调机组出力之和

负荷有功功率之和

系统网损。7.根据权利要求1所述的多级电网实时调度策略调整方法,其特征在于,所述调用预设的调度强化学习...

【专利技术属性】
技术研发人员:杨楠宋旭日黄宇鹏罗雅迪李立新於益军俞灵阎博句荣滨齐晓琳金宜放宋磊韩昳凌兆伟卫泽晨邱成建张天一李章文张风彬刘幸蔚李理狄方春刘升张鹏刘美杰李忠伟邱鹏刘蒙
申请(专利权)人:国家电网有限公司国网辽宁省电力有限公司锦州供电公司国网辽宁省电力有限公司国网冀北电力有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1