一种综合性电网安全优化调度方法技术

技术编号:39413064 阅读:8 留言:0更新日期:2023-11-19 16:04
本发明专利技术涉及一种综合性电网安全优化调度方法,其特征在于:包括以下步骤:步骤

【技术实现步骤摘要】
一种综合性电网安全优化调度方法、装置、存储介质


[0001]本专利技术属于深度强化学习
,涉及一种综合性电网安全优化调度方法,尤其是一种基于迁移学习和深度
Q
网络算法的综合性电网安全优化调度方法

装置

存储介质


技术介绍

[0002]由于高比例新能源

智能电力电子设备等广泛接入电网,我国电网运行特征中的随机性

动态性

波动性和复杂性显著增强

间歇性可再生能源
(
如风能和太阳能
)
的日益一体化和需求侧的主动响应使得当今电网的安全稳定运行条件更加多变,难以预测

在某些突发危险故障发生时,如果没有及时

有效的电网监测和调控手段,局部扰动可能会扩散,从而导致连锁故障,甚至大停电,如
2019
年7月的美国纽约曼哈顿大停电
、2020
年8月的加州大停电和
2021
年2月的美国得克萨斯州大规模停电等事故

因此,及时评估电力系统的安全水平,建立电网动态安全评估模型和实时自主决策智能体是必要的

[0003]目前,深度强化学习
(deep reinforcement learning

DRL)
技术发展迅速,在自动驾驶

工业自动化

医疗保健<br/>、
自然语言处理等多个领域成功应用,为解决高维度

高非线性

高时变性优化控制和决策问题提供了新的解决思路,同时为电网动态安全评估和智能自主控制提供了启示

深度强化学习将深度学习
(deep learning

DL)
的感知能力和强化学习
(reinforcement learning

RL)
的决策能力相结合,优势互补,可以直接根据输入的数据进行控制,是一种更接近人类思维方式的人工智能方法

其中,
DL
通过表征学习平台,学习样本数据的内在规律和表示层次,一般使用深度神经网络描述复杂物理系统的输入

输出关系
。DL
的优点在于可以自主智能地提取大量观测数据样本中有效的样本特征,而迁移学习
(transfer learning

TL)
正是深度学习中的一种流行方法,
TL
是指将一个场景下学习到的知识
(
预训练的神经网络模型
)
迁移到另一种场景去应用

具体来说,在电网动态安全评估过程中
TL
可以将从已知故障中学习到的知识应用到随机未知故障的评估中

[0004]但针对新型电网动态安全评估和实时自主控制这一复杂的决策问题,现有技术中仍存在如下的缺陷:
[0005](1)
传统的基于电网物理模型的方法在电网实时控制方面有较强局限性,且需要较为精准的数学模型,对于新型电网中结构的变化和新能源的波动性适应能力不强,不能够满足新型电网的发展需求

[0006](2)
现有技术未充分考虑新型电网在新能源随机波动情况下出现突发故障时的安全性运行问题

而且在离线训练数据库仅包含有限数量的故障时,经过训练的动态安全评估模型可能无法准确评估未知的随机故障

[0007](3)
由于一些实际问题,例如测量装置故障

通信阻塞
/
故障,甚至网络攻击等,输入的实时数据可能会存在缺失的情况,安全评估模型将无法正常工作

[0008]经检索,未发现与本专利技术相同或相似的现有技术的公开文献


技术实现思路

[0009]本专利技术的目的在于克服现有技术的不足,提出一种基于迁移学习和深度
Q
网络算法的综合性电网安全优化调度方法

装置

存储介质,在危险故障发生情况下能够制定快速

准确的在线调控决策,实现故障转移,确保电网的安全稳定运行

[0010]本专利技术解决其现实问题是采取以下技术方案实现的:
[0011]一种综合性电网安全优化调度方法,包括以下步骤:
[0012]步骤
1、
初步定义该基于迁移学习的动态安全评估方案中的变量和参数;
[0013]步骤
2、
根据步骤1初步定义的变量和参数构建基于迁移学习的动态安全评估方案总体架构;
[0014]步骤
3、
建立并更新深度
Q
网络
DQN
智能体;
[0015]步骤
4、
结合步骤2所构建的基于迁移学习
TL
的动态安全评估方案总体架构和步骤3建立的深度
Q
网络
DQN
智能体,形成基于迁移学习和深度
Q
网络算法的综合性电网安全优化调度总体架构;基于该迁移学习和深度
Q
网络算法的综合性电网安全优化调度总体架构,搭建电网环境与智能体进行交互并基于真实电网场景数据训练电网安全优化调度智能体,将训练好的电网安全优化调度智能体嵌入综合性电网安全优化调度总体架构中,通过对电网环境实时观测通过动态安全评估其判断,故障情况下调用智能体输出调度动作,实现对电网系统的智能安全调控

[0016]而且,所述步骤1的具体方法为:
[0017]初步定义基于迁移学习的动态安全评估方案中的变量和参数:源域
S、
目标域
T、
深度特征提取网络
F、
域鉴别器神经网络
D、
动态安全评估器神经网络
C
中涉及的参数和变量

[0018]而且,所述步骤2的具体步骤包括:
[0019](1)
针对电网不同运行状态进行特征学习,从不同故障的输入数据中提取出特征空间内的域不变特征;
[0020](2)
基于步骤2第
(1)
步所提取出特征空间内的域不变特征,对深度特征提取网络

域鉴别器神经网络

动态安全评估器神经网络进行参数更新方法的设计,构建完成基于迁移学习的新型电网安全调度动态安全评估方案总体架构

[0021]而且,所述步骤2第
(1)
步的具体步骤包括:
[0022]①
根据深度特征提取网络
F
将样本数据
x
映射为
M
维本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种综合性电网安全优化调度方法,其特征在于:包括以下步骤:步骤
1、
初步定义该基于迁移学习的动态安全评估方案中的变量和参数;步骤
2、
根据步骤1初步定义的变量和参数构建基于迁移学习的动态安全评估方案总体架构;步骤
3、
建立并更新深度
Q
网络
DQN
智能体;步骤
4、
结合步骤2所构建的基于迁移学习
TL
的动态安全评估方案总体架构和步骤3建立的深度
Q
网络
DQN
智能体,形成基于迁移学习和深度
Q
网络算法的综合性电网安全优化调度总体架构;基于该迁移学习和深度
Q
网络算法的综合性电网安全优化调度总体架构,搭建电网环境与智能体进行交互并基于真实电网场景数据训练电网安全优化调度智能体,将训练好的电网安全优化调度智能体嵌入综合性电网安全优化调度总体架构中,通过对电网环境实时观测通过动态安全评估其判断,故障情况下调用智能体输出调度动作,实现对电网系统的智能安全调控
。2.
根据权利要求1所述的一种综合性电网安全优化调度方法,其特征在于:所述步骤1的具体方法为:初步定义基于迁移学习的动态安全评估方案中的变量和参数:源域
S、
目标域
T、
深度特征提取网络
F、
域鉴别器神经网络
D、
动态安全评估器神经网络
C
中涉及的参数和变量
。3.
根据权利要求1所述的一种综合性电网安全优化调度方法,其特征在于:所述步骤2的具体步骤包括:
(1)
针对电网不同运行状态进行特征学习,从不同故障的输入数据中提取出特征空间内的域不变特征;
(2)
基于步骤2第
(1)
步所提取出特征空间内的域不变特征,对深度特征提取网络

域鉴别器神经网络

动态安全评估器神经网络进行参数更新方法的设计,构建完成基于迁移学习的新型电网安全调度动态安全评估方案总体架构
。4.
根据权利要求3所述的一种综合性电网安全优化调度方法,其特征在于:所述步骤2第
(1)
步的具体步骤包括:

根据深度特征提取网络
F
将样本数据
x
映射为
M
维的特征向量
f∈R
M
,即生成的特征向量
f
用于动态安全评估器神经网络
C
中,预估安全性状态标签
y
,即

生成的特征向量
f
同时被用于域鉴别器神经网络
D
中,对样本进行相应的域分类,分类标签为
d
,当样本属于源域
S
时,
d
=0;当样本属于目标域
T
时,
d
=1,即

如果无法区分输入的样本数据来自何处,则表明目标域
T
与源域
S
已经足够相似,目标域的样本数据直接应用由源域数据训练的动态安全评估器进行评估,完成从不同故障的输入数据中提取出特征空间内的域不变特征
。5.
根据权利要求3所述的一种综合性电网安全优化调度方法,其特征在于:所述步骤2第
(2)
步的具体步骤包括:

将动态安全评估器神经网络
C
在评估第
i
个样本时的损失函数表示为如下公式:域鉴别器神经网络
D
在分类第
i
个样本时的损失函数表示为如下公式:
根据步骤2第
(1)
步可知深度特征提取网络
F
嵌入动态安全评估器神经网络和域鉴别器神经网络中,通过将式
(1)
与式
(2)
组合,得到整个动态安全评估方案的目标函数,将其表示为如下公式:其中,
σ
表示两个损失函数之间的权衡参数;式
(3)
第一部分是源域的安全评估损失,第二部分是源域和目标域的域分类损失;根据式
(3)
,可通过搜索鞍点迭代更新得到最佳的参数具体如下公式所示:具体如下公式所示:

对式
(4)
和式
(5)
进行对抗性迭代计算,使用梯度的随机估计来更新参数,其公式如下:下:下:其中,
α
表示学习率;

在和之间使用了一个特殊的反转梯度层
G(
·
)
,如式
(9)
所示:其中,
I
表示单位矩阵;对于神经网络前向传播,
G(
·
)
是一个恒等变换;对于神经网络反向传播,
G(
·
)
从中提取梯度并改变其符号,将其乘以
“‑
1”,即在传递到之前,使用替换根据式
(9)
,式
(3)
可以重新表述如下公式,可直接使用
SGD
的方法更新神经网络参数:至此完成深度特征提取网络

域鉴别器神经网络

动态安全评估神经网络的参数更新,构建完成基于迁移学习的新型电网安全调度动态安全评估方案总体架构
。6.
根据权利要求1所述的一种综合性电网安全优化调度方法,其特征在于:所述步骤3的建立并更新深度
Q
网络
DQN
智能体的具体步骤包括:
(1)
选取电网中状态观测变量和执行动作变量,并设计促进电网稳定运行的奖励机制;
(2)
基于所选取的电网中状态观测变量和执行动作变量和所设计的促进电网稳定运行的奖励机制,设计深度
Q
网络
DQN
智能体中预估网络和目标网络及其更新流程和更新公式,
完成深度
Q
网络
DQN
智能体的建立和更新流程;所述步骤3第
(1)
步的具体步骤包括:


t
时段的电网系统状态
s
t
∈S
,选取电网中状态观测变量如下:其中,
I,J,K
分别表示该电网系统中有
I
条电力传输线,
J
个发电机组节点,
K
个负载节点;分别表示第
j
个发电机组节点上的有功出力

无功出力以及电压大小;表示第
h
个新能源机组节点上下一时刻的有功出力上限预测值,
H
表示
J
个机组种有
H
个新能源机组,
H

J
;分别表示第
k
个负载节点上的有功需求

无功需求以及电压大小;表示第
k
个负载节点上下一时刻的有功需求预测值;
E
i
表示第
i
条电力传输线上的开断状态,是一个布尔值变量,当
E
i
=1时表示传输线为断开状态,当
E
i
=0时表示传输线为连接状态;
rho
i
表示第
i
条电力传输线上的负载率;

选取
t
时刻电网的执行动作变量
a
t
∈A
如下式所示:其中,
Z
表示该电网系统有
Z
个可控机组;表示第
...

【专利技术属性】
技术研发人员:郭凌旭韩枭赟马世乾崇志强郝毅穆朝絮徐娜黄志刚商敬安史亚坤李振斌陈亮于光耀王天昊陈建张杰
申请(专利权)人:国网天津市电力公司国家电网有限公司天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1