基于连续时段聚类的风电功率预测方法技术

技术编号:17780541 阅读:62 留言:0更新日期:2018-04-22 09:29
本发明专利技术涉及机器学习和风力发电领域,特别涉及基于连续时段聚类的风电功率预测方法。包括,在基于相似日预测方法的基础上,分别采用Elman神经网络和支持向量机作为预测模型,进行迭代预测,确定相似时段长度:结合功率向量和气象信息,根据相似时段长度,通过两阶段搜索策略,确定相似度衡量标准,在历史数据中寻找最佳相似时段集合;基于Elman神经网络,创建风电功率预测模型,将所得到的最佳相似时段集合作为训练数据,通过风电功率预测模型进行迭代计算,完成未来时段的风电功率预测。本发明专利技术在相似日预测方法的基础上引入气象因素,采用基于聚类‑分类的相似时段选取策略,可以快速地寻找最佳相似时段集合,提高预测精度和准确率。

【技术实现步骤摘要】
基于连续时段聚类的风电功率预测方法
本专利技术涉及机器学习和风力发电领域,特别涉及基于连续时段聚类的风电功率预测方法。
技术介绍
随着世界能源的减少,可再生新能源的研发和利用成为当务之急。风能具有范围广、可再生和无污染等优点,逐步成为最具发展前景的能源。但自然风具有随机性和间歇性,大规模风电集中接入时会对电网的安全稳定运行带来威胁,风电功率预测是解决这一难题的有效途径。常用的风电功率预测方法有物理法和统计法,物理法不依赖风电场的历史数据,只需要风电场详细的物理信息和数字天气预报数据对风电场所在地进行物理建模。但由于风电场输出功率受到当地环境因素的影响,且不同时刻的地理环境因素有较大的差异,导致物理法普适性较差,很难推广。统计法则利用学习模型,在历史数据中获取输入数据(风速、风向、天气类型等)与风功率之间的映射关系,比较常见的方法有人工神经网络和支持向量机等。但由于电力系统及风速均为复杂的非线性动态过程,很难准确地描述实际情况。基于相似日的预测作为一种有效方法,已被广泛应用到负荷预测和光伏预测中,并取得了不错的效果,一些学者也尝试将其引入到风电功率预测中。通过对历史风速数据进行无监督聚类来选择相似日,解决了聚类中存在的硬划分的问题。但无监督聚类方法对样本的依赖性较大,容易产生过多的分类,预测的精度难以保障;通过将相似日细分为“相似时段”,先寻找预测时刻前12h变化相似的风电功率曲线作为“基准段”,再寻找与预测时刻后12h变化相似的日特征向量作为“预测段”,实现了层次预测,但在建立模型时,只考虑到了相似日功率之间的对应关系,并没有考虑到基准功率曲线和气象特征值的影响。
技术实现思路
针对上述问题,本专利技术提出了基于连续时段聚类的风电功率预测方法,包括:步骤1:在相似日预测方法的基础上,选择过去一年的历史功率值集合为训练集,未来3个月的功率值集合为测试集,采用Elman神经网络和支持向量机作为预测模型,分别进行迭代预测,根据不同长度的相似时段预测误差,确定相似时段长度;步骤2:结合历史功率和气象信息,根据步骤1所得的相似时段长度,采用两阶段搜索策略,在第一阶段搜索时,首先在历史功率和气象信息中提取功率向量、气象特征向量,其次,对所有功率向量进行特征提取,并采用K-means算法进行聚类,最后,通过对功率向量进行分类,确定其所属的类簇;在第二阶段搜索时,结合气象信息确定相似度衡量标准,在历史气象数据中寻找最佳相似时段集合;步骤3:基于Elman神经网络,创建风电功率预测模型,将步骤2所得到的最佳相似时段集合作为训练数据,通过风电功率预测模型进行迭代计算,完成未来时段的风电功率预测。所述步骤1具体包括:将相似时段长度分别设置为6、12、18和24小时,每日的功率误差eMAPE为:其中,pi为实际功率;为预测功率;pcap为风机开机容量;Np为每日预测数据个数,预测模型的平均功率误差为:其中,Mp为预测天数,是第j日的误差结果,根据得到的不同长度的相似时段预测误差,选择相似时段长度为12h。所述步骤2具体包括:结合功率向量与气象信息,构建特征向量Xi为:其中,N=L×D,D是每小时功率数据个数,L为相似时段长度;xi1,...,xiN为功率向量的连续N个功率值;M为功率向量区间个数;为每个区间的平均值,M取4或者6;和分别为xi1,...,xiN中的最小、最大和平均功率值,采用K-means方法对特征向量集合进行聚类,集合中元素Xi和Xj之间的距离d(Xi,Xj)为:d(Xi,Xj)=1-rij(3a)其中,rij是Xi和Xj的皮尔逊系数;和分别表示Xi和Xj的均值;和是Xi和Xj的第t个分量,T为Xi的模,T=N+M+3,类簇个数KM决定着聚类结果,KM取值范围为9至20;采用自适应KNN算法进行分类,特征向量Xi作为分类算法的样本数据,将当前时刻前L小时功率数据定义为基准向量XB,作为分类的目标向量,应用公式(3),计算目标向量与所有类簇之间的距离,选取距离最小的类簇作为分类结果;风力机捕获功率P为:其中,Cp为风轮功率系数;ρair为空气密度;S为扫过风机叶片的面积;Vwind为风速,选取预测时刻之后L小时内的气象数据,构造气象特征向量W为:W={Vmax,Vmin,Vave,sinθave,cosθave,Pave,Have,Tave}其中,Vmax为最大风速值;Vmin为最小风速值;Vave为平均风速值;sinθave为平均风向的正弦值;cosθave为平均风向的余弦值;Pave为平均压强值;Have为平均湿度,Tave为平均温度,结合曲线趋势相似性和气象特征向量的物理相似性,确定相似度衡量标准SiB为:SiB=1-[αd(XB,Xi)+(1-α)D(WB,Wi)](5)其中,α为权重系数;XB为基准特征向量;Xi为类簇Clusterf中的元素;WB为XB之后L小时的基准气象特征向量;Wi为Xi之后L小时的气象特征向量;d(·)为公式(3a)中的距离;D(·)为气象特征向量间的距离,选择欧式距离,并预先对其进行归一化处理,采用公式(5),计算基准特征向量XB与类簇Clusterf中所有元素的相似程度,排序后选取其中数值最大的Nf个元素为最佳相似时段集合Sf。所述步骤3具体包括:所述风电功率预测模型的输入向量包含两部分,一是预测时刻的气象信息,包括风速、风向正弦,风向余弦、气压、湿度和温度值,二是预测时刻之前L小时的功率向量,风电功率预测模型的输出值为预测时刻对应的功率值,将步骤2所得到的最佳相似时段集合作为训练数据,通过风电功率预测模型进行迭代计算,完成未来时段的风电功率预测。所述步骤2具体还包括:分类结果评价标准定义为目标样本与其所属类簇中所有样本的平均距离其中,d(·)是公式(3)中距离公式,Xj是类簇中的元素,是其样本总数,KM取值为13。有益效果本专利技术针对风力发电不具有明显日周期性的特点,基于相似日的预测方法,提出了基于相似时段聚类的风电功率预测方法,与相似日相比,相似时段能够从历史数据中挖掘出更多有价值的信息;气象因素的引入有助于提高功率预测的准确性;基于聚类-分类的相似时段选取策略可以快速地寻找最优集合,提高了预测精度和准确率。附图说明图1为相似时段与相似日示意图;图2为历史功率向量示意图;图3为Elman神经网络结构图;图4功率预测过程示意图;图5类簇中的功率曲线示意图;图6不同α取值时功率预测误差曲线示意图。具体实施方式下面结合附图,对实施例作详细说明。实施例1如图1所示,直接应用传统的基于相似日的方法进行风电功率预测,效果不甚理想。如果以日为单位分析数据,则上方的功率曲线由于与目标功率曲线相似程度较低会被忽略,造成信息丢失。但适当缩短时间周期后,则可挖掘历史数据中蕴含着有效信息。相似时段长度的选择非常关键,时间尺度过长,则会引入无关的数据,致使预测过程耗时且准确率降低。反之,则无法体现功率曲线的变化趋势及潜在的规律信息。以贵州地区某风电场为研究对象,实验数据取自2015年9月至2016年12月期间贵州省某风电场的运行数据,天气预报数据来源于NWP。结合功率向量与气象信息,构建新的特征向量为:其中,N=L*D,D是每小时功率数据个数,xi1,...,xiN为功率向量Pi的连续N个功率本文档来自技高网
...
基于连续时段聚类的风电功率预测方法

【技术保护点】
基于连续时段聚类的风电功率预测方法,其特征在于,包括步骤如下,步骤1:在相似日预测方法的基础上,选择过去一年的历史功率值集合为训练集,未来3个月的功率值集合为测试集,采用Elman神经网络和支持向量机作为预测模型,分别进行迭代预测,根据不同长度的相似时段预测误差,确定相似时段长度;步骤2:结合历史功率和气象信息,根据步骤1所得的相似时段长度,采用两阶段搜索策略,在第一阶段搜索时,首先在历史功率和气象信息中提取功率向量、气象特征向量,其次,对所有功率向量进行特征提取,并采用K‑means算法进行聚类,最后,通过对功率向量进行分类,确定其所属的类簇;在第二阶段搜索时,结合气象信息确定相似度衡量标准,在历史气象数据中寻找最佳相似时段集合;步骤3:基于Elman神经网络,创建风电功率预测模型,将步骤2所得到的最佳相似时段集合作为训练数据,通过风电功率预测模型进行迭代计算,完成未来时段的风电功率预测。

【技术特征摘要】
1.基于连续时段聚类的风电功率预测方法,其特征在于,包括步骤如下,步骤1:在相似日预测方法的基础上,选择过去一年的历史功率值集合为训练集,未来3个月的功率值集合为测试集,采用Elman神经网络和支持向量机作为预测模型,分别进行迭代预测,根据不同长度的相似时段预测误差,确定相似时段长度;步骤2:结合历史功率和气象信息,根据步骤1所得的相似时段长度,采用两阶段搜索策略,在第一阶段搜索时,首先在历史功率和气象信息中提取功率向量、气象特征向量,其次,对所有功率向量进行特征提取,并采用K-means算法进行聚类,最后,通过对功率向量进行分类,确定其所属的类簇;在第二阶段搜索时,结合气象信息确定相似度衡量标准,在历史气象数据中寻找最佳相似时段集合;步骤3:基于Elman神经网络,创建风电功率预测模型,将步骤2所得到的最佳相似时段集合作为训练数据,通过风电功率预测模型进行迭代计算,完成未来时段的风电功率预测。2.根据权利要求1所述的基于连续时段聚类的风电功率预测方法,其特征在于,所述步骤1具体包括:将相似时段长度分别设置为6、12、18和24小时,每日的功率误差eMAPE为:其中,pi为实际功率;为预测功率;pcap为风机开机容量;Np为每日预测数据个数,预测模型的平均功率误差为:其中,Mp为预测天数,是第j日的误差结果,根据得到的不同长度的相似时段预测误差,选择相似时段长度为12h。3.根据权利要求1所述的基于连续时段聚类的风电功率预测方法,其特征在于,所述步骤2具体包括:结合功率向量与气象信息,构建特征向量Xi为:其中,N=L×D,D是每小时功率数据个数,L为相似时段长度;xi1,...,xiN为功率向量的连续N个功率值;M为功率向量区间个数,;为每个区间的平均值,M取4或者6;和分别为xi1,...,xiN中的最小、最大和平均功率值,采用K-means方法对特征向量集合进行聚类,集合中元素Xi和Xj之间的距离d(Xi,Xj)为:d(Xi,Xj)=1-rij(3a)

【专利技术属性】
技术研发人员:彭文张智源
申请(专利权)人:华北电力大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1