光伏发电逐日系统控制方法技术方案

技术编号:39842881 阅读:6 留言:0更新日期:2023-12-29 16:33
本发明专利技术公开了光伏发电逐日系统控制方法,包括如下步骤:

【技术实现步骤摘要】
光伏发电逐日系统控制方法、电子设备及存储介质


[0001]本专利技术涉及光伏发电设备的控制
,特别涉及一种光伏发电逐日系统控制方法

电子设备及存储介质


技术介绍

[0002]在碳达峰与碳中和目标任务下,能源结构将会发生颠覆性变革

传统的以化石能源为主的能源结构由于大量的碳排放将不再适用,具有零碳排放特点的光伏发电将会成为今后新能源结构的重要组成

[0003]中国具有丰富且可再生的太阳能资源,如何高效的利用太阳能资源成为了光伏发电技术的核心问题

相关研究显示,光伏发电面板追踪系统相比于固定式系统太阳能捕获效率高出
37
%,因此光伏发电逐日系统的精确度是提高太阳能资源捕获效率的关键

目前,光伏发电逐日系统主要采用钟式跟踪方式与光电式跟踪方式

钟式跟踪方式通过计算太阳运动角度来控制电机匀速带动光伏面板转动实现跟踪,具有跟踪精度不高

需要定期校正的缺点;光电式跟踪方式通过传感器检测及一系列信号转换实现对太阳位置的跟踪,能够通过反馈调节提高精度,但决策方式复杂易出现误动

[0004]公开于该
技术介绍
部分的信息仅仅旨在增加对本专利技术的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术


技术实现思路

[0005]本专利技术的目的之一在于,提供一种光伏发电逐日系统控制方法

电子设备及存储介质,从而改善现有光伏发电逐日系统的跟踪控制精度,降低决策过程的复杂度

[0006]本专利技术的另一目的在于,提供一种光伏发电逐日系统控制方法

电子设备及存储介质,从而提高光伏发电的发电效率

[0007]为实现上述目的,根据本专利技术的第一方面,本专利技术提供了一种光伏发电逐日系统控制方法,包括如下步骤:
[0008]S110
预设参数值,参数包括自主学习率
α

奖励衰减率
γ
和贪婪度
ε

[0009]S120
建立位置

动作

价值表,每一行表示光伏面板和太阳的位置状态,每一列表示可执行的动作策略,每一个位置状态下执行动作策略后进行动作策略价值的评价,评价值用
Q
表示,位置

动作

价值表的初始评价值设置为零值;
[0010]S130
获取当前的状态信息
S
t

[S
A
(x,y),S
s
(x,y),P
t
(U,I)],其中
S
A
(x,y)、S
S
(x,y)
分别为当前光伏面板和太阳在标准坐标系下的位置坐标,
P
t
(U,I)
为当前光伏面板直流发电侧的功率值;
[0011]S140
基于
ε

greedy
策略进行动作决策,并执行动作策略
A
t

[0012]S150
获取动作后的状态信息
S
t+1

[S'
A
(x,y),S'
s
(x,y),P
t+1
(U,I)],其中
S'
A
(x,y)、S'
S
(x,y)
分别为动作后光伏面板和太阳在标准坐标系下的位置坐标,
P
t+1
(U,I)
为动作后光伏面板直流发电侧的功率值;
[0013]S160
根据动作后的状态信息
S
t+1
对所执行的动作策略
A
t
计算奖励
R
t+1
(S
t+1
|A
t
)

[0014]S170
更新位置

动作

价值表,更新规则为
[0015]Q
new
(S
t
,A
t
)

Q
old
(S
t
,A
t
)+
α
(R
t+1
+
γ
·
Q(S
t+1
,A*)

Q
old
(S
t
,A
t
))

[0016]式中,
Q
new
(S
t
,A
t
)
为当前状态的更新评价值,
Q
old
(S
t
,A
t
)
为当前状态的原评价值,
Q(S
t+1
,A*)
为动作后的状态下执行最优动作策略
A*
产生的最大估计评价值;以及
[0017]S180
检测光伏面板是否与太阳光照对准,若对准,则控制结束,若未对准,则返回步骤
S130。
[0018]进一步,上述技术方案中,自主学习率
α
表示从动作后的状态反馈中学到的新奖励值占自身奖励的比重,
α
取值范围为0~1,
α
取值越大表示从动作后的状态学到的信息越多

[0019]进一步,上述技术方案中,奖励衰减率
γ
为未来奖励的重要性,
γ
取值范围为0~1,
γ
取值越大表示决策时越重视远期奖励

[0020]进一步,上述技术方案中,贪婪度
ε
为决策动作时选择已有经验最优值的概率,1‑
ε
为决策动作时随机选择动作的概率,
ε
取值范围为0~
1。
[0021]进一步,上述技术方案中,标准坐标系根据光敏阵列板上光敏电阻的排列建立;通过太阳光聚光后投射在光敏阵列板上,根据不同光敏电阻反馈的电流值的大小来确定太阳在标准坐标系下的位置坐标

[0022]进一步,上述技术方案中,当前状态可执行动作空间集为
A
t

[A
x
,A
y
,A0],式中
A
x
、A
y
分别为光伏面板在标准坐标系下沿水平方向与垂直方向运动的位移,
A0为复位动作,当
S
S
(x本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种光伏发电逐日系统控制方法,其特征在于,包括如下步骤:
S110
预设参数值,参数包括自主学习率
α

奖励衰减率
γ
和贪婪度
ε

S120
建立位置

动作

价值表,每一行表示光伏面板和太阳的位置状态,每一列表示可执行的动作策略,每一个位置状态下执行动作策略后进行动作策略价值的评价,评价值用
Q
表示,位置

动作

价值表的初始评价值设置为零值;
S130
获取当前的状态信息
S
t

[S
A
(x,y),S
s
(x,y),P
t
(U,I)]
,其中
S
A
(x,y)、S
S
(x,y)
分别为当前光伏面板和太阳在标准坐标系下的位置坐标,
P
t
(U,I)
为当前光伏面板直流发电侧的功率值;
S140
基于
ε

greedy
策略进行动作决策,并执行动作策略
A
t

S150
获取动作后的状态信息
S
t+1

[S'
A
(x,y),S'
s
(x,y),P
t+1
(U,I)]
,其中
S'
A
(x,y)、S'
S
(x,y)
分别为动作后光伏面板和太阳在标准坐标系下的位置坐标,
P
t+1
(U,I)
为动作后光伏面板直流发电侧的功率值;
S160
根据动作后的状态信息
S
t+1
对所执行的动作策略
A
t
计算奖励
R
t+1
(S
t+1
|A
t
)

S170
更新位置

动作

价值表,更新规则为
Q
new
(S
t
,A
t
)

Q
old
(S
t
,A
t
)+
α
(R
t+1
+
γ
·
Q(S
t+1
,A*)

Q
old
(S
t
,A
t
))
,式中,
Q
new
(S
t
,A
t
)
为当前状态的更新评价值,
Q
old
(S
t
,A
t
)
为当前状态的原评价值,
Q(S
t+1
,A*)
为动作后的状态下执行最优动作策略
A*
产生的最大估计评价值;以及
S180
检测光伏面板是否与太阳光照对准,若对准,则控制结束,若未对准,则返回步骤
S130。2.
根据权利要求1所述的光伏发电逐日系统控制方法,其特征在于,所述自主学习率
...

【专利技术属性】
技术研发人员:李兵张洪阳陈博王晓霖
申请(专利权)人:中石化大连石油化工研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1