当前位置: 首页 > 专利查询>广西大学专利>正文

一种分布式可拓展量子深宽度学习的实时电压控制方法技术

技术编号:27828863 阅读:23 留言:0更新日期:2021-03-30 11:23
本发明专利技术提出一种分布式可拓展量子深宽度学习的实时电压控制方法。该方法将分布式结构和可拓展量子深宽度学习方法相结合,用于电力系统电压控制。首先,所提方法将深度学习和宽度学习的思想相结合,并引入量子力学中的密度矩阵,提出可拓展量子深宽度神经网络。其次,所提方法用可拓展量子深宽度神经网络拟合深度确定性策略梯度方法结构的四个网络,提出可拓展量子深宽度学习方法。最后,通过分布式结构对电力系统电压进行实时控制。所提方法能够实现电力系统电压实时全局最优控制,并在保证控制精度的基础上,减轻控制器的计算负担,加速计算过程,降低电压控制过程对于通信技术可靠性的要求,并保持各区域电力系统信息的隐私性。性。性。

【技术实现步骤摘要】
一种分布式可拓展量子深宽度学习的实时电压控制方法


[0001]本专利技术属于电力系统电压控制领域,涉及一种分布式的人工智能技术的实时电压控制方 法,适用于电力系统电压的实时控制。

技术介绍

[0002]随着越来越多的间歇性能源加入到电力系统中,大量间歇性能源的无功出力的不确定性 增加了电网电压越限的风险,同时也增加了电力系统对电压控制实时性的需求。现有的电网 电压控制方法以集中式的三层电压控制方法为主,电压控制指令需要逐层传递才能被执行, 这导致了现有的电压控制方法难以适用于含大量间歇性能源的电力系统。因此,有必要对电 力系统的实时电压控制方法进行研究。
[0003]近年来,随着分布式电源数量的快速增加,电力系统的规模也在迅速增大。传统的集中 式的三层电压控制方法在面对大量的发电单元时,中央控制器需要处理来自全网的大量信息, 其计算负担过大,而且集中式的控制方法对于通信技术的可靠性有很高的要求。采用分布式 的电压控制方法可以将中央控制器所需处理的大量信息分配到多个区域控制器中,能够减轻 各控制器的计算负担,加速计算过程;可以减低电压控制过程对于通信技术可靠性的要求; 还能够保持各区域电力系统信息的隐私性。此外,分布式的电压控制方法通过各个区域控制 器间的信息交流可以实现电网电压的全局最优控制。
[0004]目前,深度学习方法在多个研究领域受到了众多学者的关注,但深度学习方法的多隐含 层结构带来的学习训练速度慢的问题一直得不到特别有效的解决。宽度学习方法由于没有多 隐含层结构,其学习训练速度不受多隐含层结构的限制,但其训练精度还有待提高。深度确 定性策略梯度方法可以适用于连续动作空间,适用于电力系统电压控制中的连续控制动作。 因此,可以将深度学习方法、宽度学习方法和深度确定性策略梯度方法相结合,以期获得训 练计算速度快、训练精度高且适用于连续动作过程的方法。
[0005]在量子物理中,一个孤立系统的状态可以由量子态描述。包含孤立系统的所有信息的量 子态可以分为纯态和混合态。其中,纯态是混合态的特殊情形。多体系统中的子系统状态一 般为混合态,可以用一个密度矩阵描述该混合态。利用混合态对系统的状态进行描述,可以 准确地描述系统的状态。因此,利用混合态的密度矩阵描述系统状态可以优化智能方法对系 统输入输出关系的学习效果。
[0006]综上所述,为了代替传统的集中式的三层电压控制方法,有必要提出一种分布式的基于 量子力学和人工智能方法的实时电压控制方法。

技术实现思路

[0007]本专利技术提出一种分布式可拓展量子深宽度学习的实时电压控制方法。该方法将分布式结 构和可拓展量子深宽度学习方法相结合,通过各区域电压控制器间的信息交流以实现对全网 电压的实时控制,能在满足电压控制精度的情况下降低对通信技术的要求、减轻控制器的计 算负担并保持各区域电力系统信息的隐私性。
[0008]本专利技术提出了一种基于分布式结构的电压控制方法,该方法采用可拓展量子深宽度学习 方法训练各区域电压控制器的输入输出数据。可拓展量子深宽度学习方法主要包含两个部分, 即可拓展量子深宽度神经网络和深度确定性策略梯度方法结构。其中,可拓展量子深宽度神 经网络负责学习输入输出数据间的映射关系,可拓展量子深宽度神经网络中的密度矩阵ρ能 够更准确地描述输入数据的状态以优化神经网络的学习效果;深度确定性策略梯度方法结构 使可拓展量子深宽度学习方法能够与环境进行实时交互以获得更好的学习效果。
[0009]所提方法在使用过程中的主要步骤为:
[0010]步骤(1):将训练数据输入到可拓展量子深宽度神经网络中进行训练;
[0011]步骤(2):用训练好的可拓展量子深宽度神经网络拟合可拓展量子深宽度学习方法的四 个网络,并使用训练数据对可拓展量子深宽度学习方法进行训练;
[0012]步骤(3):通过分布式结构实现电力系统电压的实时全局最优控制。
[0013]要对可拓展量子深宽度学习方法进行训练,首先,将训练数据输入到可拓展量子深宽度 神经网络中进行训练。可拓展量子深宽度神经网络主要由两个部分组成,即深度部分和宽度 部分。将可拓展量子深宽度神经网络的输入随机分配到深度部分和宽度部分,并引入量子力 学中的密度矩阵ρ以更准确地描述输入数据的状态,以此达到最优输入数据分配的目的,所 提方法的输入数据分配方式为
[0014][0015]式中,X1为深度部分的输入数据;X2为宽度部分的输入数据;X为可拓展量子深宽度神经网 络的输入;λ为分布因数,取值范围为[0,1];ρ为密度矩阵,可由下式计算
[0016][0017]式中,|ψ
i
>和p
i
分别表示量子态的纯态和该纯态相应的概率。
[0018]深度部分隐含层的输出可以由下式计算得到
[0019]a
l+1
=f(W
l
a
l
+b
l
)
ꢀꢀꢀꢀꢀ
(3)
[0020]式中,a
l+1
和a
l
分别表示第(l+1)层和第l层隐含层的输出;W
l
表示第l层的权值矩阵;b
l
表 示第l层的偏差值矩阵;f(g)表示激活函数。
[0021]设可拓展量子深宽度神经网络共有L层隐含层,则深度部分的输出可以表示为
[0022][0023]式中,Y1表示深度部分的输出;a
L
和a
L
‑1分别表示第L层和第(L

1)层隐含层的输出;W
1L
为深度部分第L层的权值矩阵;b
L
表示第L层的偏差值矩阵。
[0024]宽度部分的输入数据X2需要先转化为特征节点矩阵Z,设输入数据X2具有
n
个特征节 点,则其特征节点转换方程可以表示为
[0025]Z
i
=φ(X2W
ei

ei
),i=1,K,n
ꢀꢀꢀꢀꢀ
(5)
[0026]式中,Z
i
表示第i个特征节点矩阵,并将所有的特征节点表示为Z
n
=[Z1,K,Z
n
];W
ei
为随 机权值矩阵;β
ei
为随机偏差值;φ(g)表示随机映射函数。
[0027]随后,特征节点矩阵被转化为增强节点矩阵,设宽度部分有
m
组增强节点,增强节
点的 转化过程可以表示为
[0028]H
i
=ξ(Z
n
W
hi

hi
),i=1,K,m
ꢀꢀꢀꢀꢀꢀ
(6)
[0029]式中,H
i
表示第i个增强节点矩阵,并将所有的增强节点表示为H
m
=[H1,K,H
m本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分布式可拓展量子深宽度学习的实时电压控制方法,其特征在于,该方法将分布式结构和可拓展量子深宽度学习方法相结合,通过各区域电压控制器间的信息交流以实现对全网电压的实时控制,能在满足电压控制精度的情况下降低对通信技术的要求,减轻控制器的计算负担并保持各区域电力系统信息的隐私性;所提方法在使用过程中的主要步骤为:步骤(1):将训练数据输入到可拓展量子深宽度神经网络中进行训练;步骤(2):用训练好的可拓展量子深宽度神经网络拟合可拓展量子深宽度学习方法的四个网络,并使用训练数据对可拓展量子深宽度学习方法进行训练;步骤(3):通过分布式结构实现电力系统电压的实时全局最优控制。2.如权利要求1所述的一种分布式可拓展量子深宽度学习的实时电压控制方法,其特征在于,所述步骤(1)中将可拓展量子深宽度神经网络的输入随机分配到深度部分和宽度部分,并引入量子力学中的密度矩阵ρ以更准确地描述输入数据的状态,以此达到最优输入数据分配的目的,所提方法的输入数据分配方式为式中,X1为深度部分的输入数据;X2为宽度部分的输入数据;X为可拓展量子深宽度神经网络的输入;λ为分布因数,取值范围为[0,1];ρ为密度矩阵,可由下式计算式中,|ψ
i
>和p
i
分别表示量子态的纯态和该纯态相应的概率;最后,可以得到可拓展量子深宽度神经网络的输出Y为式中,Y表示可拓展量子深宽度神经网络的输出;Y1和Y2分别表示深度部分和宽度部分的输出;f(g)表示激活函数;W
1L
为深度部分第L层的权值矩阵;a
L
‑1表示第(L

1)层隐含层的输出;b
L
表示第L层的偏差值矩阵;Z
n
=[Z1,K,Z
n
]表示所有的特征节点矩阵;H
m
=[H1,K,H
m
]表示所有的增强节点矩阵;W2表示宽度部分的连接权重矩阵。3.如权利要求1所述的一种分布式可拓展量子深宽度学习的实时电压控制方法,其特征在于,所述步骤(2)中提出的可拓展量子深宽度学习方法使用可拓展量子深宽度神经网络对深度确定性策略梯度方法结构中的四个网络分别进行拟合,并使用参数θ对各个网络分别进行参数化;动作网络主要用来生成一个确定性的动作策略以生成确定的动作,而评价网络主要用来模拟真实的价值函数Q以指导动作策略的更新;智能体的动作a由策略函数π确定;已知环境的瞬时状态s
t
、智能体的动作a
t
和由参数化的动作当前网络θ
μ
生成的确定性动作策略μ,可得价值函数Q为式中,E[g]表示期望值;r(s
t
,a
t
)表示在状态s
t
和动作a
t
下获得的奖励;γ表示贝尔曼方程中的折扣因子;Ψ表示与状态s
t+1
和奖励r
t
相对应的期望值分布;价值函数Q由评价当前网络θ
Q
近似表示,评价当前网络θ
Q
的损失为贝尔曼方程等号两边
的差值,该损失可以表示为式中,L(θ
Q
)表示价值函数Q的损失值;E[...

【专利技术属性】
技术研发人员:殷林飞陆悦江陆造树高放
申请(专利权)人:广西大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1