一种风电机组限功率运行的异常数据处理方法技术

技术编号:19079696 阅读:112 留言:0更新日期:2018-09-29 20:28
本发明专利技术公开了属于风电场技术领域的一种风电机组限功率运行的异常数据处理方法。通过引入风电机组限电运行状态下的合理假设,将风电机组限功率运行下的数据处理问题转化为混合概率分布模型,应用K‑Means聚类算法初始化模型参数,然后根据期望值最大化(EM)算法,推导参数更新表达式,通过迭代的方式最大化对数似然函数,得到最优模型参数,以实现限功率运行状态下风电机组异常运行数据的进行处理;本发明专利技术可以找出限功率异常运行数据,区分不同限功率程度的运行数据。并剔除离群异常数据点,得到快速稳定的数据处理效果。

【技术实现步骤摘要】
一种风电机组限功率运行的异常数据处理方法
本专利技术属于风电场
,特别涉及一种风电机组限功率运行的异常数据处理方法。
技术介绍
风能是可再生能源中发展最快且最具有开发价值的清洁能源之一,而风力发电是风能开发利用的主要形式。近年来我国风电产业发展迅速,风电场积累了大量的风电机组运行数据。风电场的历史运行数据尤其是风速和风电功率数据对风电场的运行管理和电力系统的运行调度都具有重要意义;风电机组运行数据是进行风电机组健康状态评估和风电功率预测不可或缺的数据,也是电力系统调度部门制定风电场调度计划的重要参考。上述的几方面的应用对运行数据的质量都有较高的要求,然而,实际机组的运行数据质量较差,原始运行数据通常难以达到直接应用的要求。影响运行数据质量的因素有很多,比如传感器自身的误差,恶劣的运行环境导致仪器测量精度下降,数据存储和传输故障以及风电场弃风限电等。在应用中,为达到数据质量要求,必须要经过数据处理;数据处理一般包括四个部分:缺失数据处理、重复数据处理、异常数据处理以及不一致数据处理,其中对于风电机组运行状态评估以及风电功率预测的精度来说,异常数据的识别和处理是数据预处理的重要方面,而异常数据出现的最主要原因是风电场弃风限电,从而如何准确快速识别由限功率运行造成的数据异常是重要的研究方向。现有的异常数据处理方式存在着实用性差、通用性不强、识别率较低、速度慢等问题,而且在筛选过程中难以避免人的主观因素影响,难以适用于运行数据量日益增加的风电场。基于以上问题,本专利技术提出了一种风电机组限功率运行数据清洗方法,在风电数据中掺杂了大量不同程度的限功率数据的情况下,可以准确快速的进行识别筛选,使风电数据达到较高的质量水平。风电机组原始运行数据中通常掺杂有大量异常数据,这些异常数据由多种原因导致,而现存的数据清洗方法较难针对多种运行工况下产生的复杂运行数据进行有效的数据清洗。针对以上问题,本专利技术提出的一种风电机组限功率运行数据清洗方法,该方法把异常运行数据分为由限电导致的限功率数据和由其他原因产生的离群数据,可以解决如下技术问题:可以快速高效辨识运行数据中存在的限功率程度类别,区分正常运行数据和不同程度的限功率数据,并且剔除每一类数据中的离群数据,实现风电机组原始运行数据的数据处理工作,提高风电机组运行数据质量。
技术实现思路
本专利技术的目的是提出一种风电机组限功率运行的异常数据处理方法,其特征在于,该方法包括以下步骤:步骤1:引入风电机组限功率程度和限功率出力假设,设随机变量x,y,z分别代表风电机组输出功率、机舱风速以及限功率程度,其中,x为连续型随机变量,y,z为离散型随机变量。限功率程度假设即机组的限功率程度可以用有限的限功率状态来表示。假设风电机组限功率程度z可取K个不同的值,分别对应机组正常运行状态和K-1种不同限电程度的限功率运行状态。限功率出力假设即风电机组限功率出力等于理论功率输出与对应的限功率系数相乘。假设在某一限功率程度下,风电机组限功率运行曲线可表示为x=αkf(y),其中,f(y)为风电机组理论功率曲线函数,αk为第k个限功率状态对应的限功率系数,其取值范围为αk∈[0,1],αk取值越小,则代表机组的限功率程度越大,αk取值越接近于1,则表示机组状态越趋近于正常发电状态。步骤2:建立混合概率分布模型,将风速y离散化,把风速分布范围均匀划分成J个风速区间,以各风速区间中值代表区间风速值。假设在风速和限功率程度给定的情况下,机组输出功率服从高斯分布,且分布均值等于限功率输出,即x|y=j,z=k~N(μjk,σjk),并且μjk=αkf(y(i)),mkj、sjk分别表示在给定风速区间j和限功率程度k的高斯分布均值和标准差;假设风速服从多项式分布,即y~Multimomial(y),其中向量y是多项式分布的分布参数,向量y第j个元素满足yj30,且p(y=j)=yj;不同于风速和功率,机组限功率程度z无法直接观测,为隐含随机变量,假设限功率程度也服从多项式分布,即z~Multimomial(f),其中向量f的第k个元素满足fk30,且p(z=k)=fk;此外,风速y和限功率程度z相互独立,因此p(y|z)=p(y)。根据边缘概率分布p(z)和条件概率分布p(y|z)和p(x|y,z)计算联合概率分布p(x,y,z)=p(x|y,z)p(y|z)p(z),机组输出功率的概率分布模型可通过求联合概率分布的边缘概率得到,即:式中,p(x)表示机组输出功率x的边缘概率分布,p(y=j)表示风速值y落入第j个风速区间的概率;p(z=k)表示限功率程度取k时的概率值;p(y=j|z=k)表示在限功率程度取k的条件下风速落入第j个风速区间的条件概率;p(x|y=j,z=k)表示在限功率程度为k、风速取值落入第j个风速区间的条件下,机组输出功率的条件概率。根据上述概率分布假设,若得到分布函数参数,则可以求出式(1)中各项的概率值;步骤3:初始化混合概率模型参数;步骤4:用EM算法寻找步骤3中建立的混合概率分布模型参数的最大似然估计;步骤5:根据步骤4得到混合概率分布模型参数,计算给定观测风速和功率样本下的不同限功率程度下的后验概率,根据最大后验概率将运行数据划分到不同限功率程度对应的类别中;具体包括:步骤51:计算p(z=k|x=x(i),y=y(i))即为样本点(x(i),y(i))属于限功率程度k的后验概率值,样本i的限功率程度即风速和功率在不同限功率程度下的最大后验概率作为其所属的限功率程度类别;步骤52:根据预先确定的概率决策阈值q,剔除后验概率小于等于该决策阈值的离群异常数据点,保留剩余样本数据。经过数据清洗后的不同程度的限功率数据集合为:实现不同限功率程度的运行数据的区分,并剔除离群数据。所述步骤3包括:步骤31:采用线性插值方法,根据理论功率散点数据得出理论功率曲线函数x=f(y);步骤32:随机初始化a=[a1,K,aK],y=[y1,K,yJ],f=[f1,K,fK],mjk和步骤33:采集机组观测样本集{(x(1),y(1)),...,(x(m),y(m))},其中,x(i)表示机组出力样本,y(i)表示对应的风速样本;对每个样本i,计算(x(i),y(i))到理论限功率运行功率曲线的距离找出样本到各条限功率运行曲线的距离最小的一条曲线对应的限功率程度作为样本(x(i),y(i))的限功率程度,记为样本i距离对应限功率运行曲线的距离记为步骤34:对同一限功率程度的样本集合{(x(i),y(i))|c(i)=k},用最小二乘拟合限功率运行曲线x(i)=αkf(y(i)),并更新对应的限功率系数ak;步骤35:不断重复交替进行步骤33和步骤34的过程直到收敛。步骤36:令K依次取2-8,重复步骤32到步骤35若干次,计算所有样本的平均损失值取各次的损失的平均值,以该均值作为纵轴,K值作为横轴作肘形曲线,取平均损失函数值下降幅度最大的位置对应的K值作为最佳的聚类数。步骤37:初始化参数y,f,m,s,其中其中指示函数I{c(i)=k,y(i)=j}取值为1,如果其大括号内的参数为真,否则取值为0。所述步骤4包括:步骤41:计算其中,表示给定机组出力为x(i)的条件下风速落入风速区间j,限本文档来自技高网
...

【技术保护点】
1.一种风电机组限功率运行的异常数据处理方法,其特征在于,该方法包括以下步骤:步骤1:引入风电机组限功率程度和限功率出力假设,设随机变量x,y,z分别代表风电机组输出功率、机舱的风速以及限功率程度,其中,x是连续型随机变量,y,z是离散型随机变量;假设机组的限功率程度z用有限的限功率状态来表示,并假设风电机组的限功率程度z取K个不同的值,分别对应机组正常运行状态和K‑1种不同限电程度的限功率运行状态;假设风电机组限功率出力等于理论功率输出与对应的限功率系数相乘;假设在某一限功率程度下,风电机组的限功率运行曲线表示为x=αkf(y),其中,f(y)为风电机组理论功率曲线函数,αk为第k个限功率状态对应的限功率系数,其取值范围αk∈[0,1],αk取值越小,则代表机组的限功率程度越大,αk取值越趋近于1,则表示机组状态越趋近于正常发电状态;步骤2:建立混合概率分布模型,将风速y离散化,把风速分布范围均匀划分成J个风速区间,以各风速区间中值代表区间风速值;假设在风速和限功率程度给定的情况下,机组输出功率服从高斯分布,且分布均值等于限功率输出,即x|y=j,z=k~N(μjk,σjk),并且μjk=αkf(y...

【技术特征摘要】
1.一种风电机组限功率运行的异常数据处理方法,其特征在于,该方法包括以下步骤:步骤1:引入风电机组限功率程度和限功率出力假设,设随机变量x,y,z分别代表风电机组输出功率、机舱的风速以及限功率程度,其中,x是连续型随机变量,y,z是离散型随机变量;假设机组的限功率程度z用有限的限功率状态来表示,并假设风电机组的限功率程度z取K个不同的值,分别对应机组正常运行状态和K-1种不同限电程度的限功率运行状态;假设风电机组限功率出力等于理论功率输出与对应的限功率系数相乘;假设在某一限功率程度下,风电机组的限功率运行曲线表示为x=αkf(y),其中,f(y)为风电机组理论功率曲线函数,αk为第k个限功率状态对应的限功率系数,其取值范围αk∈[0,1],αk取值越小,则代表机组的限功率程度越大,αk取值越趋近于1,则表示机组状态越趋近于正常发电状态;步骤2:建立混合概率分布模型,将风速y离散化,把风速分布范围均匀划分成J个风速区间,以各风速区间中值代表区间风速值;假设在风速和限功率程度给定的情况下,机组输出功率服从高斯分布,且分布均值等于限功率输出,即x|y=j,z=k~N(μjk,σjk),并且μjk=αkf(y(i)),mkj、sjk分别表示在给定风速区间j和限功率程度k的高斯分布均值和标准差;假设风速服从多项式分布,即y~Multimomial(y),其中风速向量y是多项式分布的分布参数,风速向量y第j个元素满足yj30,且p(y=j)=yj;不同于风速和功率,机组限功率程度z无法直接观测,为隐含随机变量,假设限功率程度也服从多项式分布,即z~Multimomial(f),其中向量f的第k个元素满足fk30,且p(z=k)=fk;此外,风速y和限功率程度z相互独立,因此p(y|z)=p(y)。根据边缘概率分布p(z)和条件概率分布p(y|z)和p(x|y,z)计算联合概率分布p(x,y,z)=p(x|y,z)p(y|z)p(z),机组输出功率的概率分布模型可通过求联合概率分布的边缘概率得到,即:式中,p(x)表示机组输出功率x的边缘概率分布,p(y=j)表示风速y的值落入第j个风速区间的概率;p(z=k)表示限功率程度取k时的概率值;p(y=j|z=k)表示在限功率程度取k的条件下风速落入第j个风速区间的条件概率;p(x|y=j,z=k)表示在限功率程度为k、风速取值落入第j个风速区间的条件下,机组输出功率的条件概率;根据上述概率分布假设,若得到分布函数参数,则求出式(1)中各项的概率值;步骤3:初始化混合概率模型参数;步骤4:用EM算法寻找步骤3中建立的混合概率分布模型参数的最大似然估计;步骤5:根据步骤4得到混合概率分布模型参数计算给定样本下的...

【专利技术属性】
技术研发人员:马远驰刘永前杨志凌韩爽李莉阎洁王一妹邵振洲张路娜
申请(专利权)人:华北电力大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1