基于随机森林的风电厂超短期风速预测方法技术

技术编号:18290087 阅读:28 留言:0更新日期:2018-06-24 05:02
本发明专利技术涉及一种基于随机森林的风电厂超短期风速预测方法,该方法根据历史风速数据通过拉依达准则剔除不良数据后,基于随机森林训练预测模型,并将其应用于超短期风速预测中,能够根据若干历史风速数据对未来风速进行超短期预测。本发明专利技术较好的保留了原有风速数据的波动特性与统计特征,具有较好的拟合特性与较小的拟合误差,同时该预测方法能够识别异常数据,规避了采样误差,能够适应实际工程需要。

【技术实现步骤摘要】
基于随机森林的风电厂超短期风速预测方法
本专利技术属于电力系统领域,具体涉及到一种基于随机森林的风电厂超短期风速预测方法。
技术介绍
我国风电近年来持续快速发展,风电的快速发展给中国经济的发展注入了新的活力。但由于风能自身固有的随机性、间歇性、波动性,风电的接入也给电力系统的安全稳定运行带来了很大的挑战,风电对电力系统规划、电力系统的可靠性及电力系统运行造成了很大影响如何评估风电容量可信度及系统的风电接纳能力的问题亟需解决。为研究风电对的影响,就需要首先对风电进行建模,而风速时间序列的生成是建模的基础。现阶段风速预测方法的拟合效果普遍不够好,存在较大误差,且对于异常数据有较大的敏感度,更有些计算方法过于复杂而难以实现,难以满足实际工程需求。
技术实现思路
针对现有技术存在的不足,本专利技术提出一种基于随机森林的风电厂超短期风速预测方法,该算法根据历史风速数据训练预测模型,并将其应用于超短期风速预测中,能够根据若干历史风速数据对未来风速进行超短期预测。本专利技术采用以下方案实现:一种基于随机森林的风电厂超短期风速预测方法,其特征在于,包括以下步骤:步骤S1:根据风力发电机采集的包含多个时间节点对应风速值的历史风速数据,将采样频率设定为每m分钟采样一次,得到M个采样点对应的M个风速采样值,并根据时间顺序构建风速-时间序列;步骤S2:利用拉依达准则对风速-时间序列中的不良数据进行判断,将不良数据剔除;步骤S3:构建训练数据集合,其中每一组训练数据由1个作为结果变量的采样点及其之前n个作为相关变量的采样点构成;步骤S4:采用随机森林策略处理训练数据集合,获得预测模型;步骤S5:将最近连续n个风速采样值输入预测模型中,获得下一采样点对应时刻的风速预测结果。优选地,步骤S2中利用拉依达准则对风速-时间序列中的不良数据进行判断采用以下公式:式中为第b个采样点的风速采样值;为全部风速采样值的平均值;为第b个采样点风速采样值的剩余误差;为全部风速采样值的标准差;遍历全部风速采样值,如某一风速采样值满足此式,则判定为不良数据,并从风速-时间序列中剔除。优选地,步骤S4中,采用随机森林策略处理训练数据集合的具体方法是:使用bootstrap方法等量有放回地随机抽取N组训练数据,构成N个子训练集,使用每个子训练集分别训练一棵CART决策回归树,从而构成基于随机森林的预测模型。优选地,步骤S5中的风速预测结果为每棵决策回归树预测结果的平均值。优选地,所述子训练集中训练数据的组数与训练数据集合中训练数据的组数相同。优选地,所述CART决策回归树根据最小基尼系数作为特征值构建。本专利技术提供的技术方案较好的保留了原有风速数据的波动特性与统计特征,具有较好的拟合特性与较小的拟合误差,同时该预测方法能够识别异常数据,规避了采样误差,能够适应实际工程需要。与现有技术相比,本专利技术还具有以下2个突出优点。1、本专利技术较好的保留了原有风速数据的波动特性与统计特征,具有较好的拟合特性与较小的拟合误差。2、本专利技术能够识别异常数据,规避了采样误差。附图说明图1为本专利技术的算法流程图。图2为本专利技术的预测效果示例。具体实施方式下面结合实例对本专利技术做进一步说明。如图1所示,本实例提供了一种基于随机森林的风电厂超短期风速预测方法,具体包括以下步骤:步骤S1:通过风力发电机获取历史风速数据,将采样频率设定为每10分钟采样一次,根据时间顺序构建风速-时间序列。步骤S2:利用拉依达准则对风速-时间序列中的不良数据进行判断,若是不良数据,则直接将其剔除:式中为第b个风速采样值;为全体风速样本的均值;为第b个风速值的剩余误差;为全体风速样本的标准差;若某风速采样值满足此式,则视为不良数据,并将其剔除。步骤S3:构建训练数据集合,每组数据由每一风速采样点及其之前10个风速采样点构成。其中相关变量为前10个采样点,并将结果变量定为这一采样点。步骤S4:对训练数据集进行处理,使用bootstrap方法等量有放回地抽取多组子训练集,每个子训练集分别训练一棵CART决策回归树,构建随机森林预测模型。步骤S5:将时序上最临近的10个风速采样值输入到随机森林预测模型中,便可获得下一时刻风速预测结果。其中,步骤S4中,子训练集中训练数据的组数与训练数据集合中训练数据的组数相同;CART决策回归树根据最小基尼系数作为特征值构建。步骤S5中的风速预测结果为每棵决策回归树预测结果的平均值。基于实际数据的预测结果如图2所示。该实例的预测误差指标如表1所示:表1本文档来自技高网...
基于随机森林的风电厂超短期风速预测方法

【技术保护点】
1.一种基于随机森林的风电厂超短期风速预测方法,其特征在于,包括以下步骤:步骤S1:根据风力发电机采集的包含多个时间节点对应风速值的历史风速数据,将采样频率设定为每m分钟采样一次,得到M个采样点对应的M个风速采样值,并根据时间顺序构建风速‑时间序列;步骤S2:利用拉依达准则对风速‑时间序列中的不良数据进行判断,将不良数据剔除;步骤S3:构建训练数据集合,其中每一组训练数据由1个作为结果变量的采样点及其之前n个作为相关变量的采样点构成;步骤S4:采用随机森林策略处理训练数据集合,获得预测模型;步骤S5:将最近连续n个风速采样值输入预测模型中,获得下一采样点对应时刻的风速预测结果。

【技术特征摘要】
1.一种基于随机森林的风电厂超短期风速预测方法,其特征在于,包括以下步骤:步骤S1:根据风力发电机采集的包含多个时间节点对应风速值的历史风速数据,将采样频率设定为每m分钟采样一次,得到M个采样点对应的M个风速采样值,并根据时间顺序构建风速-时间序列;步骤S2:利用拉依达准则对风速-时间序列中的不良数据进行判断,将不良数据剔除;步骤S3:构建训练数据集合,其中每一组训练数据由1个作为结果变量的采样点及其之前n个作为相关变量的采样点构成;步骤S4:采用随机森林策略处理训练数据集合,获得预测模型;步骤S5:将最近连续n个风速采样值输入预测模型中,获得下一采样点对应时刻的风速预测结果。2.根据权利要求1所述的基于随机森林的风电厂超短期风速预测方法,其特征在于,步骤S2中利用拉依达准则对风速-时间序列中的不良数据进行判断采用以下公式:式中为第b个采样点的风速采样值;为全部风速采样值的平均值;为第b个采样点风速采样值的剩...

【专利技术属性】
技术研发人员:林章岁叶荣黎萌王怀远江岳文温步瀛
申请(专利权)人:国网福建省电力有限公司国网福建省电力有限公司经济技术研究院
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1