一种基于数据挖掘的风电功率预测方法技术

技术编号:23162295 阅读:73 留言:0更新日期:2020-01-21 22:05
本发明专利技术提供一种基于数据挖掘的风电功率预测方法,包括以下步骤:a.数据采集与预处理;b.分别使用属性快速约简算法、互信息算法和随机森林算法选出预测模型的输入向量集;c.使用选出的输入向量,基于最小二乘支持向量回归算法初步预测出风电功率;d.算出初步预测功率与实际功率的误差,使用迭代自组织数据分析算法对误差自动分类后基于马尔科夫链原理算出误差的状态转移概率矩阵,进一步得到功率修正值;e.根据误差性能指标择优。本发明专利技术考虑了输入向量影响,并首次提出了基于迭代自组织数据分析和马尔科夫链的修正方法,不仅实现了输入向量的有效降维还提高了预测速度和精度。

A wind power forecasting method based on Data Mining

【技术实现步骤摘要】
一种基于数据挖掘的风电功率预测方法
本专利技术涉及一种基于数据挖掘的风电功率预测方法,属于可再生能源领域。
技术介绍
风能作为一种清洁的、无污染的可再生能源,必将成为21世纪的主要能源。风电机组是在波动风场环境中,实现风能捕获、传递和转换的复杂机电液一体化装备,其运行工况复杂多变,需要面临高温、高海拔、强沙尘、台风等多种极端恶劣环境条件,导致风电功率具有较高的随机性,将对电网造成不可控的瞬间冲击力,也造成了电网电压质量不可控。风电功率具有间歇性、随机性和波动性,由此给电网安全运行带来了一系列问题的同时也使电网调度缺乏做好各类电源调度计划的依据。因此,及时有效的预测风电功率进行成为了极具研究价值和前景的问题。基于SCADA系统对风电机组的有功功率(简称风电功率)进行预测是一种潜在的低成本解决方案,不需要额外的传感器,近年来已经开发了一些使用这些数据进行风电功率预测的方法。SCADA系统记录的内容包括风况相关数据、能量转换相关数据、振动和温度数据等参数。而现有的SCADA系统往往缺乏有效的算法来预测风电功率。因此,基于SCADA数据建立准确、有效的功率预测算法成为了极具研究价值和前景的问题,不仅能够指导电力部门的发电计划和并网控制,也为机组的运行状态评估系统提供新的思路根据预测时间的长短,风电预测一般可分为超短期预测、短期预测、中期预测和长期预测。目前研究主要集中于短期和超短期尺度内,前者可安排机组组合和发电计划,后者主要用于电力系统实时调度。受各种不确定因素影响,中长期尺度的风电预测研究相对较少,其主要用于制定风电场的检修计划。影响风电功率预测模型的输入向量有许多,而输入向量集的维数过高会削弱模型的泛化能力。因此,如何从众多的输入向量中提取出对风电功率预测结果影响较大的特征向量组成输入向量集,是提高智能方法建立非线性预测即风电功率预测精确度首要考虑的问题。属性约简是粗糙集理论中一项重要的应用,目前已广泛运用于机器学习和数据挖掘等领域中,邻域粗糙集是粗糙集理论中处理连续型数据的一种重要方法,且利用邻域粗糙集模型下正域与属性集的单调关系指导属性选择算法可提高运算速度。而基于随机森林的封装式特征选择算法,也通过实验证明了该算法在分类性能和特征子集选择两方面具有较好的性能。同时,互信息值的高低反映了变量之间相关度的大小,故可以用来衡量某个特征输入向量和风电功率的相关性,如果信息量越大,那么特征向量和风电功率的相关性越大,故也可用来选取与风电功率有关特征变量。支持向量机克服了人工神经网络训练时间长、泛化能力差、易陷入局部极小的缺点,提高了学习泛化能力,与阈值法、贝叶斯分类算法、秩和等算法相比,具有优越的预测性能,同时还能保持较低的误报率,具有最好的综合性能,但其本身存在求解规模过大和超平面参数选择的问题。最小二乘支持向量回归算法从机器学习损失函数着手,使用二范数优化目标函数,并利用等式约束条件代替支持向量回归标准算法中的不等式约束条件,克服了支持向量回归在大规模问题中存在的训练速度较慢的缺点,并且采用了修剪法,支持稀疏性。虽然最小二乘支持向量机的整体预测精度优于支持向量机和模块概率神经网络,但单一使用最小二乘支持向量回归算法预测风电功率也存在不够精确的问题,可通过与马尔科夫链理论相结合来进行功率的修正,而马尔科夫链必须结合有效的聚类方法才能进一步提高预测精度。常见的动态聚类算法有k均值聚类和迭代自组织数据分析算法,对于非监督分类,事先很难确定待分类的集合中到底有多少类,迭代自组织数据分析算法作为一种无监督分类机器学习方法,相较于传统的k均值算法,该算法不需要人为地指定聚类的数目,能够通过设置阈值参数、动态地进行类的合并或分裂,自动调节聚类的数目,以迭代操作划分为较为理想的聚类结果。综上所述,尽管目前存在多种功率预测的算法,但由于算法本身的缺陷或局限性,导致预测结果不够精确,本专利技术结合最小二乘支持向量回归、迭代自组织数据分析和马尔代夫链算法,充分发挥各算法的不同优势以提高预测精度。
技术实现思路
本专利技术的目的在于针对现有技术的不足之处,本专利技术提出一种基于数据挖掘技术的风电功率预测方法,通过分析SCADA系统的实时数据,预测出下一时间段的风电功率。本专利技术所述问题是以下技术方案实现的:首先对SCADA的全部监测量进行预处理,对处理后的监测量使用基于邻域粗糙集的属性快速约简、随机森林和互信息三种特征选择算法筛选出对功率预测有重要影响的向量,并将筛选结果作为预测模型的输入向量集,然后利用最小二乘支持向量回归算法对风电功率做初步预测,最后基于迭代自组织数据分析算法和马尔科夫链理论对预测结果做了修正。上述基于数据挖掘的风电功率预测方法按以下步骤进行;a.数据采集与预处理:采集风电机组某一时间段(如12小时)的SCADA系统全部连续监测项目的秒级数据,对数据进行平均化处理(如一分钟)和归一化处理,其中归一化处理数据的公式如下:式中,xij为归一化后的第j个监测向量的第i时刻的值;m为监测向量的维度;n为监测向量的个数;x’ij为xij平均化处理后的值;x’jmax、x’jmin分别为第j个监测量的最大值和最小值。b.输入向量的筛选:使用步骤a得到的数据,分别使用基于邻域粗糙集的属性快速约简算法、互信息算法、随机森林算法对全部连续量监测项目进行筛选,通过设置各个算法的参数分别选出相同数量的与风电功率相关的项目组成功率预测模型的输入向量集;c.功率初步预测:对步骤b选出的监测量项目的数据进行分段,前5/6作为训练集,后1/6作为测试集,使用最小二乘支持向量回归算法初步预测出测试集所在时间段的风电功率,算法的核函数选用高斯径向基核函数,公式如下:k(x,xj)=exp(-||x-xj||2/2σ2)式中,xj∈Rn为第j个监测向量;σ为宽度参数。d.功率修正:算出步骤c中的预测功率与实际功率的误差ei,使用迭代自组织数据分析算法对误差自动分类后,再基于马尔科夫链原理算出误差的状态转移概率矩阵,分别将状态转移概率矩阵中的转移概率与对应的误差相乘并相加后叠加到功率初步预测值上,至此得到最终功率预测值yci。其中,ei=y′i-yi式中,y’i为第i时刻的初步功率预测值;yi为第i时刻的功率实际值;β是为了调整修正程度引入的修正系数;pgh为状态转移概率矩阵中的元素(假定i时刻的功率误差值处在状态“g”);ck为误差划分的类别数;zh为第h类误差的聚类中心值。e.根据误差性能指标择优:分别求取各个输入向量集对应的预测功率与实际功率的误差性能指标均方根误差(RMSE)、标准化均方根误差(NRMSE)和平均绝对误差(MAE),选取误差指标综合最小的预测值作为本专利技术预测出的最终风电功率值。误差指标的计算公式如下:式中,ymax为功率实际值的最大值;ymin为功率实际值的最小值。附图说明图1为本专利技术风电功率预测方法的流程图;图2为本实施例中SCADA系本文档来自技高网
...

【技术保护点】
1.一种基于数据挖掘的风电功率预测方法,其特征在于,使用数据挖掘技术对功率预测模型进行了输入向量的筛选、初步预测和最终修正。/n

【技术特征摘要】
1.一种基于数据挖掘的风电功率预测方法,其特征在于,使用数据挖掘技术对功率预测模型进行了输入向量的筛选、初步预测和最终修正。


2.根据权利要求1所述的一种基于数据挖掘的风电功率预测方法,其特征是,它包括以下步骤:
a.数据采集与预处理:采集风电机组某一时间段的SCADA系统全部连续监测项目的秒级数据,对数据进行平均化处理和归一化处理;
b.输入向量的筛选:使用步骤a得到的数据,分别使用基于邻域粗糙集的属性快速约简算法、互信息算法、随机森林算法对全部连续量监测项目进行筛选,通过设置各个算法的参数分别选出相同数量的与风电功率相关的项目组成功率预测模型的输入向量集;
c.功率初步预测:对步骤b选出的监测量项目的数据进行分段,前5/6作为训练集,后1/6作为测试集,使用最小二乘支持向量回归算法初步预测出测试集所在时间段的风电功率;
d.功率修正:算出步骤c中的预测功率与实际功率的误差,使用迭代自组织数据分析算法对误差自动分类后基于马尔科夫链原理算出误差的状态转移概率矩阵,分别将状态转移概率矩阵中的转移概率与对应的误差相乘并相加后叠加到功率初步预测值上,至此得到功率修正值;
e.根据误差性能指标择优:分别求取各个输入向量集对应的预测功率与实际功率的误差性能指标均方根误差(RMSE)、标准化均方根误差(NRMSE)和平均绝对误差(MAE),选取误差指标综合最小的预测值作为本发明预测出的最终风电功率值。


3.根据权利要求2所述的一种基于数据挖掘的风电功率预测方法,其特征在于:
步骤a中...

【专利技术属性】
技术研发人员:李俊卿李秋佳
申请(专利权)人:华北电力大学保定
类型:发明
国别省市:河北;13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1