基于随机森林的风机输出功率短期预测方法技术

技术编号:18290086 阅读:23 留言:0更新日期:2018-06-24 05:02
本发明专利技术涉及一种基于随机森林的风机输出功率短期预测方法,该方法根据风力发电机输出功率历史数据通过拉依达准则剔除不良数据后,基于随机森林基础训练预测模型,能够根据当前及之前若干时刻输出功率数据对风力发电机输出功率进行超短期预测。本发明专利技术的输出功率预测数据拟合度较好,和原有数据的误差较小,较好保留了原有数据的统计特性以及时域特性,能够满足实际工程需求,为电力系统接纳风电提供重要基础。

【技术实现步骤摘要】
基于随机森林的风机输出功率短期预测方法
本专利技术属于电力系统领域,具体涉及到一种基于随机森林的风机输出功率短期预测方法。
技术介绍
近年来,随着风电装机容量的迅猛发展,风电并网规模越来越大。由于风能自身固有的随机性、间歇性、波动性,风电并网也给传统电网带来冲击,对系统稳态特性与暂态过程均产生了不可忽视的影响,同时风电的接入更对经济调度和安全运行产生了挑战,电力系统如何消纳风电成为了亟待解决的问题。为研究风电对电力系统的影响,目前多采用采用时序仿真方法,首先需要对风电时间序列进行建模,然后应用随机生产模拟系统运行,统计各项运行指标得到结果,而风电输出功率时间序列建模便是一个基础且不可或缺的环节。现阶段风电预测精度仍然不够高,或是计算方法过于复杂且难以实现,很多方法无法兼顾风电输出功率的统计特性与时域特性,难以满足实际工程需求。
技术实现思路
基于现有技术存在的不足,本专利技术提出一种基于随机森林的风机输出功率短期预测方法,该算法以风力发电机输出功率历史数据为基础训练预测模型,在对输出功率进行预测时,能够根据当前及之前若干时刻输出功率数据对风力发电机输出功率进行超短期预测。本专利技术采用以下方案实现:一种基于随机森林的风机输出功率短期预测方法,其特征在于,包括以下步骤:步骤S1:根据风力发电机包含多个时间节点对应输出功率值的历史输出功率数据,将采样频率设定为每m分钟采样一次,得到M个采样点对应的M个输出功率采样值,并根据时间顺序构建输出功率-时间序列;步骤S2:利用拉依达准则对输出功率-时间序列中的不良数据进行判断,将不良数据剔除;步骤S3:构建训练数据集合,取输出功率-时间序列中的连续n+1个输出功率采样值作为一组训练数据;其中前n个输出功率采样值作为相关变量,第n+1个输出功率采样值作为结果变量;步骤S4:采用随机森林策略处理训练数据集合,获得预测模型;步骤S5:将最近连续n个风力发电机输出功率采样值输入预测模型中,获得下一采样点对应时刻的风力发电机输出功率预测结果。优选地,步骤S2中利用拉依达准则对输出功率-时间序列中的不良数据进行判断采用以下公式:式中为第b个采样点的输出功率采样值;为全部输出功率采样值的均值;为第b个采样点输出功率采样值的剩余误差;为全部输出功率采样值的标准差;遍历全部输出功率采样值,如某一输出功率采样值满足此式,则判定为不良数据,并从输出功率-时间序列中剔除。优选地,步骤S4中,采用随机森林策略处理训练数据集合的具体方法是:使用bootstrap方法等量有放回地从训练数据集合中随机抽取N组训练数据,构成N个子训练集,使用每个子训练集分别训练一棵CART决策回归树,所有所述CART决策回归树构成基于随机森林的预测模型。优选地,步骤S5中的输出功率预测结果为每棵决策回归树预测结果的平均值。优选地,所述子训练集中训练数据的组数与训练数据集合中训练数据的组数相同。优选地,所述CART决策回归树根据最小基尼系数作为特征值构建。本专利技术提供的技术方案输出功率预测数据拟合度较好,和原有数据的误差较小,较好保留了原有数据的统计特性以及时域特性,能够满足实际工程需求,为电力系统接纳风电提供重要基础。与现有技术相比,本专利技术还具有以下2个突出优点。1、本专利技术的输出功率预测数据拟合度较好,和原有数据的误差较小。2、本专利技术较好保留了原有数据的统计特性以及时域特性。附图说明图1为本专利技术的算法流程图。图2为本专利技术的预测效果示例。具体实施方式下面结合实例对本专利技术做进一步说明。如图1所示,本实例提供了一种基于随机森林的风机输出功率短期预测方法,具体包括以下步骤:步骤S1:获取风力发电机的历史输出功率数据,输出功率数据采样频率为每15分钟一次,根据时间顺序构建输出功率-时间序列。步骤S2:采用拉依达准则对风速-时间序列中的不良数据进行筛选并剔除。式中为第b个输出功率采样值;为全体输出功率样本的均值;为第b个输出功率值的剩余误差;为全体输出功率样本的标准差;若某输出功率采样值满足此式,则视为不良数据,并将其剔除。步骤S3:形成训练数据集,取每一输出功率采样点及其之前10个输出功率采样点作为一个训练数据。其中前10个采样点视为相关变量,将这一采样点视为结果变量。步骤S4:从训练数据集中,使用bootstrap方法有放回、等量地随机抽取若干组子训练集,每组子训练集分别训练一棵CART决策回归树,所有决策回归树构建随机森林预测模型。其中,子训练集中训练数据的组数与训练数据集合中训练数据的组数相同;CART决策回归树根据最小基尼系数作为特征值构建。步骤S5:输入时间上临近的前10个风机输出功率采样值给训练好的随机森林预测模型,即可得到下一时刻风机输出功率预测结果,预测结果为每棵决策回归树预测结果的平均值。基于实际数据的预测结果如图2所示。该实例的预测误差指标如表1所示:表1本文档来自技高网...
基于随机森林的风机输出功率短期预测方法

【技术保护点】
1.一种基于随机森林的风机输出功率短期预测方法,其特征在于,包括以下步骤:步骤S1:根据风力发电机包含多个时间节点对应输出功率值的历史输出功率数据,将采样频率设定为每m分钟采样一次,得到M个采样点对应的M个输出功率采样值,并根据时间顺序构建输出功率‑时间序列;步骤S2:利用拉依达准则对输出功率‑时间序列中的不良数据进行判断,将不良数据剔除;步骤S3:构建训练数据集合,取输出功率‑时间序列中的连续n+1个输出功率采样值作为一组训练数据;其中前n个输出功率采样值作为相关变量,第n+1个输出功率采样值作为结果变量;步骤S4: 采用随机森林策略处理训练数据集合,获得预测模型;步骤S5:将最近连续n个风力发电机输出功率采样值输入预测模型中,获得下一采样点对应时刻的风力发电机输出功率预测结果。

【技术特征摘要】
1.一种基于随机森林的风机输出功率短期预测方法,其特征在于,包括以下步骤:步骤S1:根据风力发电机包含多个时间节点对应输出功率值的历史输出功率数据,将采样频率设定为每m分钟采样一次,得到M个采样点对应的M个输出功率采样值,并根据时间顺序构建输出功率-时间序列;步骤S2:利用拉依达准则对输出功率-时间序列中的不良数据进行判断,将不良数据剔除;步骤S3:构建训练数据集合,取输出功率-时间序列中的连续n+1个输出功率采样值作为一组训练数据;其中前n个输出功率采样值作为相关变量,第n+1个输出功率采样值作为结果变量;步骤S4:采用随机森林策略处理训练数据集合,获得预测模型;步骤S5:将最近连续n个风力发电机输出功率采样值输入预测模型中,获得下一采样点对应时刻的风力发电机输出功率预测结果。2.根据权利要求1所述的基于随机森林的风机输出功率短期预测方法,其特征在于,步骤S2中利用拉依达准则对输出功率-时间序列中的不良数据进行判断采用以下公式:式中为第b个采样点的输出功率采样值;为全部输出功率采样值的...

【专利技术属性】
技术研发人员:黎萌叶荣林章岁王怀远江岳文温步瀛
申请(专利权)人:国网福建省电力有限公司国网福建省电力有限公司经济技术研究院
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1