一种风场协同控制方法、终端及计算机可读存储介质技术

技术编号:24576233 阅读:93 留言:0更新日期:2020-06-21 00:25
本发明专利技术提供了一种风场协同控制方法、终端及计算机可读存储介质,其中,风场协同控制方法包括步骤:构建风场模型;在所述风场模型中通过集成深度确定性策略梯度下降方法训练,得到K个预训练的策略网络和K个预训练的Q网络,其中,K为大于1的整数;将预训练的策略网络和Q网络作为初始网络,在实际环境中通过集成深度确定性策略梯度下降方法学习实际最优策略;采用最优策略对风场进行协同控制。相比传统的通过试错得到最优控制策略的方法,本发明专利技术预训练过程有效减少了实际学习过程中的平均学习成本,而集成策略的方法减少了学习过程中策略的随机性,进而减小了学习成本的随机性。

A wind field cooperative control method, terminal and computer readable storage medium

【技术实现步骤摘要】
一种风场协同控制方法、终端及计算机可读存储介质
本申请涉及风力发电
,尤其涉及一种风场协同控制方法、终端及计算机可读存储介质。
技术介绍
随着对环境问题关注度的提高,推动清洁能源发展的正成为目前能源发展主要的目标。风能作为清洁能源的一个重要组成部分,目前面临的一个主要问题是如何减少尾流效应,通过风场中所有风机的协同控制最大化风场总体出力。已有的通过强化学习方法不构建尾流模型的风场协同控制方法,是通过试错得到最优控制策略,然而该方法的学习过程存在随机性,学习成本高。因此,现有技术还有待发展。
技术实现思路
本申请所要解决的技术问题在于提供一种风场协同控制方法、终端及计算机可读存储介质,旨在解决现有的风场协同控制方法学习过程存在随机性、学习成本高的问题。为解决上述技术问题,本申请是这样实现的,一种风场协同控制方法,其特征在于,包括步骤:构建风场模型;在所述风场模型中通过集成深度确定性策略梯度下降方法训练,得到K个预训练的策略网络和K个预训练的Q网络,其中,K为大于1的整数;将本文档来自技高网...

【技术保护点】
1.一种风场协同控制方法,其特征在于,包括步骤:/n构建风场模型;/n在所述风场模型中通过集成深度确定性策略梯度下降方法训练,得到K个预训练的策略网络和K个预训练的Q网络,其中,K为大于1的整数;/n将预训练的策略网络和Q网络作为初始网络,在实际环境中通过集成深度确定性策略梯度下降方法学习实际最优策略;/n采用最优策略对风场进行协同控制。/n

【技术特征摘要】
1.一种风场协同控制方法,其特征在于,包括步骤:
构建风场模型;
在所述风场模型中通过集成深度确定性策略梯度下降方法训练,得到K个预训练的策略网络和K个预训练的Q网络,其中,K为大于1的整数;
将预训练的策略网络和Q网络作为初始网络,在实际环境中通过集成深度确定性策略梯度下降方法学习实际最优策略;
采用最优策略对风场进行协同控制。


2.如权利要求1所述的风场协同控制方法,其特征在于,所述风场模型包括风力发电机出力模型和尾流模型;
风力发电机出力模型为:P=2a(cos(γ)-a)2ArU∞2;
其中P是风力发电机出力,γ是偏转角,U∞是自由风速,Ar是风机叶面面积,a是轴向诱导因子,为控制变量,表示为:其中Ur为自由风通过风力发电机后的风速;
尾流模型为:U(x,y,a)=U∞(1-ud)



其中(x,y)表示风机所在位置,ud表示减少风速的比例,D是风机叶面的直径,k是粗糙度系数。


3.如权利要求2所述的风场协同控制方法,其特征在于,单个策略网络和单个Q网络的训练方法包括:
初始化策略网络μ(s|θμ)和Q网络Q(a,s|θQ),其中,θQ表示Q网络参数,θμ表示策略网络参数,s表示状态;
初始化具有相同权重的目标Q网络Q′(θQ′)和目标策略网络μ′(θμ′);
初始化重放缓冲区;
在所述风场模型中,通过深度确定性策略梯度下降方法训练策略网络和Q网络。


4.如权利要求3所述的风场协同控制方法,其特征在于,所述在所述风场模型中,通过深度确定性策略梯度下降方法训练策略网络和Q网络的步骤,包括:
接受随机的模型状态s0;
根据策略网络μ得到行为a0:a0=μ(s0|θμ)+No;其中,No为高斯噪声;
在所述风场模型中执行行为a0,并获得奖励ro;
将转变(s0,a0,r0)存储在所述重放缓冲区,并从所述重放缓冲区的转变中随机采样n个数据构成一个批量,n为大于1的整数;
对策略网络、Q网络、目标策略网络和目标Q网络进行更新;
对上述步骤进行迭代直至收敛,完成策略网络和Q网络的预训练。


5.如权利要求4所述的风场协同控制方法,其特征在于,所述对策略网络、Q网络、目标策略网络和目标Q网络进行更新的步骤,包括:
通过最小化损失L更新Q网络,损失方程为:



yi=ri+γQ′(si,μ′(si|θμ′)|θQ′)
其中,i表示小批量中的第i个样本,ri为批量数据中第i个数据的奖励,yi为第i个数据的目标值,si...

【专利技术属性】
技术研发人员:赵俊华赵焕梁高琪
申请(专利权)人:香港中文大学深圳
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1