【技术实现步骤摘要】
基于积分式强化学习的自适应最优AGC控制方法
[0001]本专利技术涉及电力系统及其自动化领域,具体是基于积分式强化学习的自适应最优AGC控制方法。
技术介绍
[0002]现今电力系统的结构日趋复杂,不断拓展延伸到许多偏远地区,然而由于距离和自然条件的限制,偏远地区的输电成本高昂,与其他区域联络线的数量有限或没有联络线,当区间联络线发生故障时当地电力系统易成为孤岛运行的单区域系统,因此维持单区域电网稳定运行的AGC控制策略就显得较为重要。与此同时,新能源发电在这些地区电力系统中往往占据较大的比重,由于风机、光伏或潮汐发电机组输出功率的不稳定性,导致电网的频率响应容易产生波动,再加上单区域系统的机组总惯量较小,难以调节发电端和负荷端的随机波动,造成较大的频率偏差。另一方面,频繁的频率波动带来的系统调整动作也使得调速器等发电机组部件老化加快,增加运营维护成本。基于最优控制理论的AGC控制方法通过最小化所定义的与频率偏差量、机组出力相关的代价函数来达到控制目的,但从目前已有研究情况来看,现有的最优控制方法需要系统的完整的动态信息, ...
【技术保护点】
【技术特征摘要】
1.基于积分式强化学习的自适应最优AGC控制方法,其特征在于,包括以下步骤:1)建立所述单区域电力系统频率响应模型,并计算出电力系统状态空间矩阵。2)基于强化学习中的策略迭代算法,建立评判者
‑
执行者神经网络;所述评判者
‑
执行者神经网络包括评判者网络和执行者网络;3)将电力系统状态空间矩阵输入到评判者
‑
执行者神经网络中,解算得到最优控制策略;4)执行者网络在电力系统中执行所述最优控制策略。2.根据权利要求1所述的基于积分式强化学习的自适应最优AGC控制方法,其特征在于:所述电力系统的器件包括调速器、涡轮机、发电机转子和负载。3.根据权利要求1所述的基于积分式强化学习的自适应最优AGC控制方法,其特征在于,单区域电力系统频率响应模型如下所述:式中,ΔX
g
(t)为调速器阀门开度变化增量;为增量ΔX
g
(t)的微分;ΔP
g
(t)为发电机输出变化量;为增量ΔP
g
(t)的微分;Δf(t)为频率误差增量;为增量Δf(t)的微分;ΔI(t)为频率误差积分增量;为增量ΔI(t)的微分;ΔP
d
(t)为负荷增量;T
g
、T
t
、T
p
分别为调速器、涡轮机、发电机时间常数;K
p
、K
e
分别为发电机增益和积分控制增益;R
d
为调速器速度下降率;u(t)为t时刻的控制策略;其中,调速器阀门开度变化增量ΔX
g
(t)、发电机输出变化量ΔP
g
(t)、频率误差增量Δf(t)和频率误差积分增量ΔI(t)为单区域电力系统频率响应模型的状态变量;负荷增量ΔP
d
(t)为扰动变量。4.根据权利要求1所述的基于积分式强化学习的自适应最优AGC控制方法,其特征在于,电力系统状态空间矩阵如下所示:式中,x(t)表示状态变量;表示状态变量的微分;其中,矩阵A、矩阵B和矩阵F分别如下所示:
式中,R为控制变量权重。5.根据权利要求1所述的基于积分式强化学习的自适应最优AGC控制方法,其特征在于,所述评判者网络、执行者网络均包括输入层、隐藏层和输出层;评判者网络的激活函数为χ(x)=[χ1(x),χ2(x),...,χ
N
(x)]
T
;χ1(x)、χ2(x)、...、χ
N
(x)为评判者网络隐藏层中的神经元;神经元总数N≥n(n+1)/2;n为系统中状态变量的个数。6.根据权利要求1所述的基于积分式强化学习的自适应最优AGC控制方法,其特征在于,评判者网络输出代价函数V(x)的步骤包括:1)建立代价函数V(x)估计表达式,即:V(x)=w
T
χ(x)+ε
a
(x)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)式中,w=[w1,w2,...,w
N
]
T
是激活函数向量χ(x)的权重向量;ε
a
(x)是估计误差;代价函数V(x)对于状态变量x的偏导如下所示:2)评判者网络通过自适应参数估计方法对权重参数向量进行学习,得到权重向量估计值此时,代价函数表达为评判者网络的估计值、估计误差和自适应估计误差之和...
【专利技术属性】
技术研发人员:许懿,欧睿,胡润滋,蒙永苹,张明媚,杨渝璐,周宇晴,熊伟,廖新颖,李德智,甘潼临,刘伟,许洁,李光杰,李郅浩,
申请(专利权)人:重庆大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。