基于强化学习的自适应新能源超短期功率预测方法及装置制造方法及图纸

技术编号:34179210 阅读:21 留言:0更新日期:2022-07-17 12:40
本发明专利技术涉及一种基于强化学习的自适应新能源超短期功率预测方法及装置,所述方法包括获取用于构建自适应智能体的环境变量、动作空间及奖励函数;其中,环境变量为反映环境特点的环境变量指标,动作空间为智能体决策采取的动作函数集合,奖励函数为智能体在动作执行后,环境变量相应变化的评价结果;根据所述环境变量、和奖励函数构建自适应智能体;对环境变量进行处理,利用处理后的环境变量对自适应智能体进行训练,得到自适应预测智能体。本发明专利技术将根据环境变量自适应选取与外部环境最契合的单一类预测方法预测结果,从而最大限度提升预测结果准确率。本申请提供的方法实施流程简单,具有较强的应用前景。具有较强的应用前景。具有较强的应用前景。

【技术实现步骤摘要】
基于强化学习的自适应新能源超短期功率预测方法及装置


[0001]本专利技术属于电力
,具体涉及一种基于强化学习的自适应新能源超短期功率预测方法及装置。

技术介绍

[0002]近年来,以风电、光伏为主的新能源快速发展,在电网中规模日益增大。新能源功率预测技术是电网运行控制的基础数据。当前我国提出构建以新能源为主体的新型电力系统,可以预见未来新能源在电力系统中的规模将快速增加。在新能源规模日益增大的背景下,其预测准确率对电网运行效益的影响日益凸显,成为当前研究的重点。
[0003]当前已有大量关于新能源功率预测技术的研究。从实现方式来看,当前新能源功率预测技术整体可分为下列两类:
[0004](1)单一类预测方法,即所采用预测方法是基于单一的技术原理实现对新能源功率的预测,例如时序外推法、相关因素预测法等;
[0005](2)综合类预测方法,即将多个单一类预测方法的结果整合,以最大限度降低不同单一类预测方法在实际预测中的局限性限制,保障最后的预测结果具有尽可能高的预测精度和预测稳定性。
[0006]由于单一类预本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的自适应新能源超短期功率预测方法,其特征在于,包括:获取用于构建自适应智能体的环境变量、动作空间及奖励函数;其中,所述环境变量为反映环境特点的环境变量指标,所述动作空间为智能体决策采取的动作函数集合,所述奖励函数为智能体在动作执行后,所述环境变量相应变化的评价结果;根据所述环境变量、动作空间和奖励函数构建自适应智能体;对所述环境变量进行处理,利用处理后的环境变量对所述自适应智能体进行训练,得到自适应预测智能体。2.根据权利要求1所述的方法,其特征在于,所述获取用于构建自适应智能体的环境变量,包括:获取与新能源功率变化相关的基础数据,根据所述基础数据获取环境变量。3.根据权利要求1或2所述的方法,其特征在于,所述获取用于构建自适应智能体的动作空间,包括:通过动作空间为每个单一类预测方法选取情况状态变量;动作函数集合为A={a1,a2,

a
N
}其中,A为动作函数集合,a1、a2、a3表示三种不同的单一类预测方法选取情况状态变量,a1、a2、a3取值范围0或1,若取值为“1”,表明该单一类预测方法被选为该环境变量特点下的预测方法;若取值为“0”,表明该单一类预测方法未被选为该环境变量特点下的预测方法。4.根据权利要求1所述的方法,其特征在于,所述奖励函数包括:预测准确率奖励和动作空间不合规处罚;其中,预测准确率奖励是指自适应预测智能体预测准确率指标水平;而动作空间不合规处罚则是对动作空间不满足要求时的处罚;所述奖励函数为:R=α1R1‑
α2P2式中,R为奖励函数,R1为预测准确率奖励函数,P2为动作空间不合规处罚函数,α1、α2分别为预测准确率奖励函数和动作空间不合规处罚函数的权重系数,α1、α2均为大于0的系数,且α1>>α2。5.根据权利要求4所述的方法,其特征在于,所述预测准确率奖励函数为新能源功率预测准确率函数;其中,P
F
、P
A
分别为新能源功率预测功率和实际...

【专利技术属性】
技术研发人员:蔡莹罗微
申请(专利权)人:广东电网有限责任公司广州供电局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1