主动配电网优化调度方法、系统、设备及存储介质技术方案

技术编号：41311312 阅读：19 留言：0更新日期：2024-05-13 14:54

本发明专利技术属于电力系统自动化领域，公开了一种主动配电网优化调度方法、系统、设备及存储介质，包括获取主动配电网各区域的光伏出力预测值和负荷预测值；根据各区域的光伏出力预测值和负荷预测值，调用预设的基于联盟博弈的分布式优化调度模型，得到各区域的各可控设备最优出力值；根据各区域的各可控设备最优出力值生成各区域的各可控设备控制指令，并发送至各区域的各可控设备；其中，基于联盟博弈的分布式优化调度模型包括联盟博弈层和与联盟博弈层交互的各区域智能体。基于各区域基于博弈机制的非关键信息共享实现分布式协同优化，避免了大量数据的集中收集和处理，大幅提升决策速度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于电力系统自动化领域，涉及一种主动配电网优化调度方法、系统、设备及存储介质。

技术介绍

1、随着电力系统来的发展，电网的源荷不确定性日益突出，传统的配电网运行方式在提高能源利用效率方面存在很多不足。随着新型电力系统建设，分布式电源高渗透率接入配电网成为必然趋势，传统配电网逐渐向主动配电网转化。分布式电源大量接入能够提高主动配电网清洁能源比重，但同时导致主体多元化趋势加剧，传统集中式优化调度效率降低，多主体隐私性也将面临威胁。因此，需要在保护主体隐私的前提下，实现分布式协同优化调度，充分消纳可再生能源并缓解间歇性分布式电源对主动配电网的冲击，保证系统安全稳定运行。

2、针对主动配电网的优化调度问题，目前较为普遍的求解方法主要包括模型驱动和数据驱动两类。其中，模型驱动是充分运用配电网成熟机理的优化调度方法，目前的研究主要集中在分布式优化，且主要应用原始对偶梯度法及一致性理论等分布式优化方法。然而，高比例可再生能源接入使得电网规模逐渐扩大，对系统实时调度决策提出了更高的要求。同时，部分基于物理机理的优化方法虽然考虑了可再生能源的不确定性特征，但机理方法仍然不可避免地依赖于可再生能源的准确预测，在保证系统能量平衡的准则下，若预测精度偏低则系统实际出力便会偏离最优策略，此时系统经济性难以保证。因此，模型驱动方法面临瓶颈。

3、深度强化学习作为数据驱动的典型方法，融合了深度学习的感知能力和强化学习的决策能力，适合于解决高维决策问题。深度强化学习通过进行离线训练缩短在线决策的时间，并且不依赖机理建模和可再生

技术实现思路

1、本专利技术的目的在于克服上述现有技术的缺点，提供一种主动配电网优化调度方法、系统、设备及存储介质。

2、为达到上述目的，本专利技术采用以下技术方案予以实现：

3、本专利技术第一方面，提供一种主动配电网优化调度方法，包括：

4、获取主动配电网各区域的光伏出力预测值和负荷预测值；

5、根据各区域的光伏出力预测值和负荷预测值，调用预设的基于联盟博弈的分布式优化调度模型，得到各区域的各可控设备最优出力值；

6、根据各区域的各可控设备最优出力值生成各区域的各可控设备控制指令，并发送至各区域的各可控设备；

7、其中，基于联盟博弈的分布式优化调度模型包括联盟博弈层和与联盟博弈层交互的各区域智能体；联盟博弈层基于市场中间价机制进行各区域智能体的全局约束控制并进行各区域智能体的联盟利益分配；各区域智能体以主动配电网总运行成本最小化为目标函数，结合各区域智能体的联盟利益，基于约束马尔科夫决策过程设计状态空间、动作空间、控制策略函数、奖励函数和约束回报函数得到。

8、可选的，所述联盟博弈层基于市场中间价机制进行各区域智能体的全局约束控制并进行各区域智能体的联盟利益分配包括：

9、基于各区域的光伏出力预测值和负荷预测值，得到各区域的净功率需求；并基于各区域的净功率需求，通过下式得到主动配电网在t时刻的净负荷功率ptnl、净发电功率ptng和净功率需求ptre：

10、

11、其中，是n号区域在t时刻的净功率需求，n为主动配电网联盟，n+为净功率需求为正的区域集合，n-为净功率需求为负的区域集合；

12、当ptre＝0时，当ptre<0时，当ptre>0时，其中，为t时刻上级电网单位购电电价和t时刻上级电网单位售电电价的中间值；为区域间单位购电电价，为区域间单位售电电价；

13、且当t时刻由ij支路相连的区域n向区域m卖电时：

14、

15、其中，为n号区域节点i在t时刻的联络线功率，为m号区域节点j在t时刻的联络线功率，为n号区域在t时刻的单位售电电价，为m号区域在t时刻的单位购电电价；

16、以各区域智能体协同优化相比于单独优化所降低的总成本为效益函数，通过下式得到各区域智能体的联盟利益：

17、

18、δ(t,n,s)＝v(t,s∪{n})-v(t,s)

19、

20、其中，v(t,s)代表t时刻区域通过组成区域联盟s所获得的效益，为区域联盟s的净负荷功率，为区域联盟s的净发电功率，为上级电网单位购电电价，为上级电网单位售电电价，δ(t,n,s)为n号区域加入区域联盟s的边际贡献，n为区域总数，s为区域联盟s的区域数，φn(t,n,v)为n号区域智能体在t时刻的联盟利益，n/{n}为n除去n号区域后剩余区域的联盟。

21、可选的，所述各区域智能体以主动配电网总运行成本最小化为目标函数，结合各区域智能体的联盟利益，基于约束马尔科夫决策过程设计状态空间、动作空间、控制策略函数、奖励函数和约束回报函数时，状态空间其中，为n号区域在t时刻的光伏出力预测值，为n号区域在t时刻的负荷预测值；

22、动作空间其中，和分别为n号区域节点i燃气机组在t时刻的有功出力和无功出力；和分别为n号区域节点i储能系统在t时刻的有功功率和无功功率；

23、控制策略函数为dn维多元高斯分布函数，并利用深度神经网络作为控制策略函数分布参数的学习网络；

24、奖励函数其中，为对n号区域智能体在控制策略πn下产生的所有奖励值取均值，t为优化调度周期时刻，γ∈[0,1]为各区域智能体对不同时刻奖励偏好程度的折扣系数，rn,t为t时刻n号区域智能体的奖励值；

25、约束回报函数其中，为对n号区域智能体在控制策略πn下产生的所有约束回报值取均值，cn,t为t时刻n号区域智能体的约束回报值。

26、可选的，所述控制策略函数具体为：

27、

28、其中，πn(sn,θn)为n号区域智能体在sn和θn下的控制策略，μn为均值向量，σn为多元高斯分布的协方差矩阵；sn为n号区域智能体的状态，an为n号区域智能体的动作，θn为n号区域智能体的控制策略函数的分布参数的学习网络的参数，为n号区域智能体的控制策略函数的分布参数的学习网络的近似函数。

29、可选的，所述t时刻n号区域智能体的奖励值rn,t为：

30、

31、其中，为n号区域智能体在t时刻的区域运行成本奖励，为n号区域智能体在t时刻的联盟贡献奖励，α为预设比例系数；

32、

33、

34、其中，为n号区域智能体在t时刻的购电成本，为n号区域智能体在t时刻的发电成本，φn(t,n,v本文档来自技高网...

【技术保护点】

1.一种主动配电网优化调度方法，其特征在于，包括：

2.根据权利要求1所述的主动配电网优化调度方法，其特征在于，所述联盟博弈层基于市场中间价机制进行各区域智能体的全局约束控制并进行各区域智能体的联盟利益分配包括：

3.根据权利要求1所述的主动配电网优化调度方法，其特征在于，所述各区域智能体以主动配电网总运行成本最小化为目标函数，结合各区域智能体的联盟利益，基于约束马尔科夫决策过程设计状态空间、动作空间、控制策略函数、奖励函数和约束回报函数时，状态空间其中，为n号区域在t时刻的光伏出力预测值，为n号区域在t时刻的负荷预测值；

4.根据权利要求3所述的主动配电网优化调度方法，其特征在于，所述控制策略函数具体为：

5.根据权利要求3所述的主动配电网优化调度方法，其特征在于，所述t时刻n号区域智能体的奖励值Rn,t为：

6.根据权利要求3所述的主动配电网优化调度方法，其特征在于，所述t时刻n号区域智能体的约束回报值Cn,t为：

7.根据权利要求1所述的主动配电网优化调度方法，其特征在于，在调用预设的基于联盟博弈的分布式优化调度模型前，还包括：

8.根据权利要求7所述的主动配电网优化调度方法，其特征在于，所述在保证各区域智能体的约束回报函数值满足约束价值上限的基础上，以最大化各区域智能体的奖励价值函数值为优化目标，更新各区域智能体的控制策略函数的分布参数的学习网络的参数包括：

9.一种主动配电网优化调度系统，其特征在于，包括：

10.根据权利要求9所述的主动配电网优化调度系统，其特征在于，所述联盟博弈层基于市场中间价机制进行各区域智能体的全局约束控制并进行各区域智能体的联盟利益分配包括：

11.根据权利要求9所述的主动配电网优化调度系统，其特征在于，所述各区域智能体以主动配电网总运行成本最小化为目标函数，结合各区域智能体的联盟利益，基于约束马尔科夫决策过程设计状态空间、动作空间、控制策略函数、奖励函数和约束回报函数时，状态空间其中，为n号区域在t时刻的光伏出力预测值，为n号区域在t时刻的负荷预测值；

12.根据权利要求11所述的主动配电网优化调度系统，其特征在于，所述控制策略函数具体为：

13.根据权利要求11所述的主动配电网优化调度系统，其特征在于，所述t时刻n号区域智能体的奖励值Rn,t为：

14.根据权利要求11所述的主动配电网优化调度系统，其特征在于，所述t时刻n号区域智能体的约束回报值Cn,t为：

15.根据权利要求9所述的主动配电网优化调度系统，其特征在于，在调用预设的基于联盟博弈的分布式优化调度模型前，还包括：

16.根据权利要求15所述的主动配电网优化调度系统，其特征在于，所述在保证各区域智能体的约束回报函数值满足约束价值上限的基础上，以最大化各区域智能体的奖励价值函数值为优化目标，更新各区域智能体的控制策略函数的分布参数的学习网络的参数包括：

17.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述主动配电网优化调度方法的步骤。

18.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至8任一项所述主动配电网优化调度方法的步骤。

...

【技术特征摘要】

1.一种主动配电网优化调度方法，其特征在于，包括：

4.根据权利要求3所述的主动配电网优化调度方法，其特征在于，所述控制策略函数具体为：

5.根据权利要求3所述的主动配电网优化调度方法，其特征在于，所述t时刻n号区域智能体的奖励值rn,t为：

6.根据权利要求3所述的主动配电网优化调度方法，其特征在于，所述t时刻n号区域智能体的约束回报值cn,t为：

7.根据权利要求1所述的主动配电网优化调度方法，其特征在于，在调用预设的基于联盟博弈的分布式优化调度模型前，还包括：

9.一种主动配电网优化调度系统，其特征在于，包括：

10.根据权利要求9所述的主动配电网优化调度系统，其特征在于，所述联盟博弈层基于市场中间价机制进行各区域智能体的全局约束控制并进行各区域智能...

【专利技术属性】
技术研发人员：蒲天骄，杜帅，乔骥，陈予尧，王梓博，马世乾，
申请(专利权)人：中国电力科学研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人