【技术实现步骤摘要】
一种区域电网自动发电控制方法、装置、设备及介质
[0001]本专利技术涉及区域电网自动发电控制
,尤其涉及一种区域电网自动发电控制方法、装置、设备及介质。
技术介绍
[0002]随着化石能源供应紧张、温室效应等环境问题日益严峻,实现可再生能源转型是中国乃至全球能源发展的必然趋势。而传统AGC控制以PID控制为主,其主要单一化地根据区域控制误差值(area control error,ACE)来确定总调节功率,以控制机组出力。
[0003]由于电力系统新形态下区域间互动变化灵活,各种分布式能源不断并入电网,以PID控制为主的传统AGC系统需要根据长期历史数据进行学习、分析、存储,来多区域进行协同控制,而传统的控制方法由于强随机扰动,导致的分布式电网控制性能愈来愈差,存在在强随机性负荷情况下电网频率稳定性低的问题。
技术实现思路
[0004]本专利技术提供了一种区域电网自动发电控制方法、装置、设备及介质,解决了现有的控制方法由于强随机扰动,导致的分布式电网控制性能愈来愈差,存在在强随机性负荷情况下电网频率稳定性低的技术问题。
[0005]本专利技术提供的一种区域电网自动发电控制方法,包括:
[0006]初始化所述区域电网中的算法控制器内的初始参数,并通过所述区域电网获取初始功率偏差和初始频率偏差;
[0007]根据所述初始参数、所述初始功率偏差和所述初始频率偏差,确定对应的初始状态并更新值函数矩阵,生成目标值函数矩阵;
[0008]根据所述初始状态关联的全部初 ...
【技术保护点】
【技术特征摘要】
1.一种区域电网自动发电控制方法,其特征在于,包括:初始化所述区域电网中的算法控制器内的初始参数,并通过所述区域电网获取初始功率偏差和初始频率偏差;根据所述初始参数、所述初始功率偏差和所述初始频率偏差,确定对应的初始状态并更新值函数矩阵,生成目标值函数矩阵;根据所述初始状态关联的全部初始动作更新行为效用跟踪矩阵并统计当前时刻的状态访问次数;采用所述状态访问次数更新贪婪因子,并根据所述贪婪因子、所述目标值函数矩阵和所述行为效用跟踪矩阵,确定目标动作;通过所述算法控制器执行所述目标动作,输出总功率指令。2.根据权利要求1所述的区域电网自动发电控制方法,其特征在于,所述根据所述初始参数、所述初始功率偏差和所述初始频率偏差,确定对应的初始状态并更新值函数矩阵,生成目标值函数矩阵的步骤,包括:采用所述初始功率偏差和所述初始频率偏差,计算初始区域控制偏差;将所述初始区域控制偏差输入至所述算法控制器,确定所述区域电网对应的初始系统状态;采用所述初始区域控制偏差和所述初始频率偏差,计算目标奖励值;根据所述状态访问次数、所述初始参数中的回放经验池、所述初始系统状态和所述目标奖励值更新值函数矩阵,生成目标值函数矩阵。3.根据权利要求2所述的区域电网自动发电控制方法,其特征在于,所述根据所述状态访问次数、所述初始参数中的回放经验池、所述初始系统状态和所述目标奖励值更新值函数矩阵,生成目标值函数矩阵的步骤,包括:提取回放经验池内的历史时刻动作;采用所述历史时刻动作、所述初始系统状态和所述目标奖励值更新值函数矩阵,生成中间值函数矩阵;若所述状态访问次数小于或等于预设次数阈值,则将所述中间值函数矩阵作为目标值函数矩阵;若所述状态访问次数大于预设次数阈值,则采用所述回放经验池中的全部动作、所述初始系统状态和所述目标奖励值依次更新所述中间值函数矩阵,生成目标值函数矩阵。4.根据权利要求1所述的区域电网自动发电控制方法,其特征在于,所述行为效用跟踪矩阵的更新公式为:矩阵的更新公式为:矩阵的更新公式为:
式中,E
t
(a
i
)表示在t时刻每一个动作的行为效用跟踪值;a
t
‑1表示在t
‑
1时刻的动作;a
t
‑2表示在t
‑
2时刻的动作;r
t
表示当前时刻的目标奖励值;e表示探索激励值;a
i
表示智能体的动作集合的第i个动作;β表示行为效用跟踪因子;E
t
‑1(a
i
)表示在t
‑
1时刻的每一个动作的行为效用跟踪值;t表示当前时刻;v(s
t
)表示状态访问函数;s
t
表示当前状态;V表示状态访问集合。5.根据权利要求1所述的区域电网自动发电控制方法,其特...
【专利技术属性】
技术研发人员:李江南,毛田,章彬,赵文猛,王滔,周保荣,
申请(专利权)人:深圳供电局有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。