基于图像的风力发电功率曲线异常数据识别与清洗方法技术

技术编号:24125025 阅读:33 留言:0更新日期:2020-05-13 04:18
本发明专利技术属于信息技术领域,涉及一种基于图像的风力发电功率曲线异常数据识别与清洗方法,包括以下步骤:1)建立映射关系,将风力发电的散点数据转化为二值数字图像;2)将二值数字图像转化为特征灰度图像;3)对特征灰度图像进行识别,进行数据清洗。本发明专利技术通过栅格化散点数据,建立散点数据与数字图像之间的映射,将基于传统数据挖掘算法的数据清洗问题转化为图像分割问题,运用成熟的图像分割算法来解决数据清洗问题。

【技术实现步骤摘要】
基于图像的风力发电功率曲线异常数据识别与清洗方法
本专利技术属于信息
,涉及一种基于图像的风力发电功率曲线异常数据识别与清洗方法。
技术介绍
风能是一种清洁和可再生的能源。近年来,世界各地安装的风力发电机越来越多,风电机组安装的数据采集与监视控制系统已经广泛的用于风力发电工况检测,其中包括风电曲线异常数据检测。风电功率曲线是在风电机组运行特性的评价过程中的一项重要指标,即是风电机组的设计依据、性能评价指标、发电量考核指标,与风电场的收益也息息相关。由于风速和风向的变化导致风力发电具有波动性、间歇性和随机性等特点,所以SCADA数据包含不同类型的异常数据,这会对风力发电机运行状态和特性的分析产生不利影响。基于风电功率曲线的异常数据可以归纳为以下三种类型:I类为负异常数据,II类为离散异常数据,III类为堆积异常数据。如图1所示。(1)I类异常数据是风速大于切入速度且功率低于零的负异常数据。当风力发电机吸收来自电网的功率时,功率输出将被记录为负值。负异常数据大多接近于零。产生I型异常数据的主要原因有计划外维修、风机故障和风力削减等。(2)II类异常数据是离散的异常数据。它们围绕正常曲率随机分布。传感器故障,传感器噪声和一些不受控制的随机因素导致这些异常数据。因此,它们遵循随意分布,并且不可预测且不连续。(3)III类异常数据是堆叠的异常数据。这些异常数据通常出现在连续的时间段内,并在功率曲线中排成一行。因此,当数量很大时,它们很容易识别为正常数据。它们通常由限电命令或通信故障引起,尤其是限电期间和限功率运行。数据清洗是风电场运行和维护过程中的一个重要环节,风电机组功率曲线的异常数据的识别与清洗是当前的研究热点。常规方法主要基于离散的数据点,利用与正常数据不同的异常数据的统计特征来清理异常数据,包括数据密度、距离、方差等。常规的基于数据的方法主要问题是大量的堆叠数据没有得到有效的清理,主要原因是假设正常数据是主体成分,并根据主体成分的统计特征来检测异常数据,当风力出现经常缩减时,大量堆叠的异常数据也会成为主体成分。文献LongH,SangL,WuZ,andGuW.Image-basedabnormaldatadetectionandcleaningalgorithmviawindpowercurve[J].IEEETransactionsonSustainableEnergy.2019(04),1-1,提出一种基于图像的数学形态学操作方法,分为以下三步:1)预处理清洗:过滤并检测I类异常点(负异常数据)满足v>vcut-in且p<0,其中vcut-in是切入速度。2)基于图像的正常数据提取:对I类异常数据进行过滤后,其余数据的散点绘图将转化为数字图像,基于每个像素点的灰度值,将该灰度图进一步转换为二值图像。然后,用图像数学形态学的开运算提取风电曲线图像的主要部分。计算提取风电曲线的主要部分与参考模板(由专家手工标记的标准风电曲线模型)的相似度差异(图像不变矩的欧式距离),确定开运算中的结构单元的大小。3)识别图像边缘,过滤位于边缘外的数据,确定为II类异常数据(离散异常数据);保留正常数据,其余部分视为III类异常数据(堆叠的异常数据)。将风力散点映射为散点绘图中的像素点,基于映射关系标记正常和三种类型的异常数据。其主要的问题在于会清除掉风速从零到切入风速时功率为零的正常数据和风速大于额定风速时功率稳定的正常数据,参见图2。
技术实现思路
为解决上述
技术介绍
中存在的问题,本专利技术提出一种基于图像的风力发电功率曲线异常数据识别与清洗方法,该方法可以准确识别与清洗在风力发电场安装的数据采集与监视控制系统中所采集风力发电数据的风电曲线异常数据。本专利技术解决上述问题的技术方案是:一种基于图像的风力发电功率曲线异常数据识别与清洗方法,其特殊之处在于,包括以下步骤:1)建立映射关系,将风力发电的散点数据转化为二值数字图像;2)将二值数字图像转化为特征灰度图像;3)对特征灰度图像进行识别,进行数据清洗。进一步地,所述步骤1)具体为:通过栅格化将散点数据的散点划分到不同的框,每个框代表数字图像中的一个像素点,(x,y)是数字图像f(x,y)的一个像素点,其中x=1,...,M,y=1,...,N,第i个数据点是(vi,pi),其中v是风速,p是功率;像素与数据点之间的缩放参数是(Δx,Δy),Pmax,Pmin分别代表最大和最小功率,vmax,vmin分别代表最大和最小风速;第i个像素(xi,yi)与数据点之间的对应可以由式(1)计算,通过缩放参数,一个像素点可以对应许多数据点;有数据对应的像素点的灰度值设为255,其余像素点的灰度值设为0,图像的尺寸大小M×N由式(2)计算通过以上方式可建立风电数据点与生成的数字图像的映射关系,生成的二值数字图像。进一步地,所述步骤2)具体为:计算有值像素点到连通域边界的像素在八个方向上的距离,然后计算距离的中位数作为当前像素的灰度值。进一步地,所述步骤3)包括以下步骤:3.1)在确定阈值t下,以异常数据对应的像素为背景,正常数据对应的像素为前景,计算图像的类不确定性,通过类不确定性理论对图像进行分析;3.2)然后将分类不确定性与参考模板的傅里叶描述子结合构建能量函数,通过最小化能量函数寻找最优阈值t;3.3)最后,通过阈值分割结果,对前景和背景进行分割,根据之前的映射关系,达到识别和分类正常数据和异常数据的作用。进一步地,所述步骤3.1)具体为:在灰度特征图中,令C表示图像中灰度值零以上的所有像素(不包含零,黑色背景不计入),令c表示某一个元素,且c∈C。令Fo,t和Fb,t表示有阈值t产生的空间元素属于前景和背景的集合,此时前景属于正常数据,背景属于要清洗的异常数据,其表达式为Fo,t={c|c∈Candf(c)≥t}Fb,t={c|c∈Candf(c)≥t}由阈值t产生前景概率为其中,|X|表示X的数量。这里引入集合G=[MIN,MAX],MIN表示一副图像中的最小的灰度值,MAX表示一副图像中的最大的灰度值。在阈值t的条件下,我们可以将po(g)和pb(g)写成概率密度函数的形式,则其中,mo(t)和mb(t)分别表示前景像素的灰度均值和背景像素的灰度均值,σo(t)和σb(t)分别表示前景像素和背景像素的标准差。在阈值t情况下,将类不确定性表达为阈值为t的函数,当灰度值为g时,其公式为:其中,pt(g)如公式所示pt(g)=θ(t)po,t(g)+(1-θ(t))pb,t(g)在阈值为t时,对于每个像素点,可以得到不同的熵Ht(g)来表示当前像素点的类不确定性。将其小到大按照由蓝到绿再到红可视化,可以得到代表类不确定的能量图。当t发生变化时,可以得到不同阈值下能本文档来自技高网
...

【技术保护点】
1.一种基于图像的风力发电功率曲线异常数据识别与清洗方法,其特征在于,包括以下步骤:/n1)建立映射关系,将风力发电的散点数据转化为二值数字图像;/n2)将二值数字图像转化为特征灰度图像;/n3)对特征灰度图像进行识别,进行数据清洗。/n

【技术特征摘要】
1.一种基于图像的风力发电功率曲线异常数据识别与清洗方法,其特征在于,包括以下步骤:
1)建立映射关系,将风力发电的散点数据转化为二值数字图像;
2)将二值数字图像转化为特征灰度图像;
3)对特征灰度图像进行识别,进行数据清洗。


2.根据权利要求1所述的一种基于图像的风力发电功率曲线异常数据识别与清洗方法,其特征在于:
所述步骤1)具体为:
通过栅格化将散点数据的散点划分到不同的框,每个框代表数字图像中的一个像素点,(x,y)是数字图像f(x,y)的一个像素点,其中x=1,...,M,y=1,...,N,第i个数据点是(vi,pi),其中v是风速,p是功率;像素与数据点之间的缩放参数是(Δx,Δy),Pmax,Pmin分别代表最大和最小功率,vmax,vmin分别代表最大和最小风速;第i个像素(xi,yi)与数据点之间的对应可以由式(1)计算,通过缩放参数,一个像素点可以对应许多数据点;有数据对应的像素点的灰度值设为255,其余像素点的灰度值设为0,



图像的尺寸大小M×N由式(2)计算



通过以上方式可建立风电数据点与生成的数字图像的映射关系,生成的二值数字图像。


3.根据权利要求2所述的一种基于图像的风力发电功率曲线异常数据识别与清洗方法,其特征在于:
所述步骤2)具体为:
计算有值像素点到连通域边界的像素在八个方向上的距离,然后计算距离的中位数作为当前像素的灰度值。


4.根据权利要求1-3任一所述的一种基于图像的风力发电功率曲线异常数据识别与清洗方法,其特征在于:
所述步骤3)包括以下步骤:
3.1)在确定阈值t下,以异常数据对应的像素为背景,正常数据对应的像素为前景,计算图像的类不确定性,通过类不确定性理论对图像进行分析;
3.2)然后将分类不确定性与参考模板的傅里叶描述子结合构建能量函数,通过最小化能量函数寻找最优阈值t;
3.3)最后,通过阈值分割结果,对前景和背景进行分割,根据之前的映射关系,达到识别和分类正常数据和异常数据的作用。


5.根据权利要求4所述的一种基于图像的风力发电功率曲线异常数据识别与清洗方法,其特征在于:
所述步骤3.1)具体为:
在灰度特征图中,令C表示图像中灰度值零以上的所有像素,令c表示某一个元素,且c∈C,令Fo,t和Fb,t表示有阈值t产生的空间元素属于前景和背景的集合,此时前景属于正常数据,背景属于要清洗的异常数据,其表达式为:
Fo,t={c|c∈Candf(c)≥t}
Fb,t={c|c∈Candf(c)≥t}
由阈值t产生前景概率为:



其中,|X|表示X的数量;
这里引入集合G=[MIN,MAX],MIN表示一副图像中的最小的灰度值,MAX表示一副图像中的最大的灰度值;在阈值t的条件下,我们可以将po(g)和pb(g)写成概率密度函数的形式,则






其中,mo(t)和mb(t)分别表示前景像素的灰度均值和背景像素的...

【专利技术属性】
技术研发人员:梁国远宿亚浩陈帆周力凯吴新宇
申请(专利权)人:深圳先进技术研究院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1