【技术实现步骤摘要】
一种面向风电机组功率曲线数据的离群点判别方法
本专利技术涉及一种数据离群点判别方法,特别涉及一种面向风电机组功率曲线数据的离群点判别方法。
技术介绍
在传统化石能源储量日益匮乏和环境恶化加剧的现代社会,风能作为一种新能源替代选择之一而因其环境友好、储量丰富以及可再生的优异特性而广泛为大众所关注,我国风电设备的总装机量以及装机量增速也逐渐跃居为全球排名前三甲。在我国,随着大数据技术在工业领域的逐渐普及,近十年内风力发电行业从选址、布局、建设,到风电机组优化、调度、控制,再到后续的评估、运维、管理等方面均有着长足的进步,但在我国风电行业飞速发展的同时,居高不下的运维费用仍然是阻碍风力发电行业广泛部署的主要因素。由于风电机组的能量来源——风本身具有间歇性与高度不确定性的随机特点,且由于现有传感器的测量问题而导致相关数据在测量过程中会出现数值偏移等异常问题,致使风电机组在运行过程中测量得到的数据中包含很多的异常信息及噪声信息,从而对判断风电机组的运行状况、量化风电机组发电性能以及判断风电机组故障情况产生十分严重的负面影响,进一步造成巨额的运维支出。因此,如何判断风电机组数据的异常问题,是利用智能大数据分析技术解决风力发电领域中行业痛点问题与降低风力发电行业运维管理成本的重中之重。考虑到风电机组的功率曲线数据在评估风电机组发电性能方面十分重要,因此对于风电机组功率曲线数据的准确获取是进一步进行详细分析的首要基础。而对于风电机组的功率曲线数据而言,如何将包含异常数据以及噪声数据在内的数据集信息处理为统一的、准确的数据信息则是研究的重点内容。然而,目前现有的功率曲线数据 ...
【技术保护点】
1.一种面向风电机组功率曲线数据的离群点判别方法,其特征在于,包括以下步骤:1)根据待评估风电机组功率曲线获取需求,读取相应需求周期内总计N条待评估风电机组的SCADA系统中测量得到的风电机组运行数据信息,该信息包含风速{vi}、有功功率{Pi}、桨距角{βi}、风电机组运行状态{Condi}、环境气压{Bi}以及环境温度{Ti},将信息数据集记为
【技术特征摘要】
1.一种面向风电机组功率曲线数据的离群点判别方法,其特征在于,包括以下步骤:1)根据待评估风电机组功率曲线获取需求,读取相应需求周期内总计N条待评估风电机组的SCADA系统中测量得到的风电机组运行数据信息,该信息包含风速{vi}、有功功率{Pi}、桨距角{βi}、风电机组运行状态{Condi}、环境气压{Bi}以及环境温度{Ti},将信息数据集记为其中i=1,2,3,…,N;2)将步骤1)中的信息数据集进行数据预处理操作,剔除机组异常运行状态并修正空气密度的影响,保留余下的N′条运行数据作为预处理后的风电机组正常数据集{Xi},其中i=1,2,3,…,N′;3)将步骤2)得到的正常数据集{Xi}中的风速信息以及功率信息{Pi}合成为功率曲线散点数据集{PCi},即其中i=1,2,3,…,N′;4)对步骤3)得到的功率曲线散点数据集{PCi}中的风速信息以及功率信息{Pi}分别进行归一化,得到归一化功率曲线散点数据集{PCnorm,i},其中i=1,2,3,…,N′;5)分别按照一定的风速间隔(ws)和功率间隔(ap)将步骤4)中的归一化功率曲线散点数据集{PCnorm,i}各划分为M个区间,并分别记第j个区间中的数据个数为Mseg,j、归一化功率曲线散点数据集为其中seg={ws,ap},j=1,2,3,…,M,l=1,2,3,…,Mseg,j;6)利用均值距离判别(AVDC)离群点检测算法分别对步骤5)中的2M个区间进行疑似离群点检测,并分别记第j个区间的疑似离群点个数为归一化功率曲线疑似离群点集为其中seg={ws,ap},j=1,2,3,…,M,l=1,2,3,…,Mseg,j;所述均值距离判别(AVDC)离群点检测算法具体为:对于数据个数Mseg,j小于给定最小阈值δM的区间,认为该区间归一化功率曲线疑似离群点集为否则对于第j个风速区间或第j个功率区间,首先计算区间内归一化功率曲线数据集中各数据点的判别距离进一步设定疑似离群点的占比并确定第j个区间中疑似离群点个数通过由大到小对判别距离进行排序的方式确定前个数据构成第j个区间的归一化功率曲线疑似离群点集所述判别距离的计算方式具体如下:其中分别为第j个风速区间内归一化功率曲线数据集的功率平均值和第j个功率区间内归一化功率曲线数据集的风速平均值,l=1,2,3,…,Mseg,j;7)分别利用局部异常因子(LOF)以及考虑噪声的基于密度的聚类(DBSCAN)这两种离群点检测算法对步骤5)中的2M个区间进行判别离群点检测,并分别记第j个区间的判别离群点个数为归一化功率曲线判别离群点集为其中seg={ws,ap},j=1,2,3,…,M,l=1,2,3,…,Mseg,j,method={LOF,DBSCAN};8)基于真实离群点判别准则,从步骤6)的功率曲线疑似离群点集和步骤7)的功率曲线判别离群点集中获取真实离群点集其中seg={ws,ap},j=1,2,3,…,M,method={LOF,DBSCAN};所述真实离群点判别准则定义为:对于第j个区间的归一化功率曲线数据集中的任一数据点Q,若其属于疑似离群点集并且属于LOF判别离群点集或DBSCAN判别离群点集之一,则点Q为第j个区间的真实离群点;9)基于步骤8)中得到的各风速区间真实离群点集以及各功率区间真实离群点集利用最终离群点判断准则获得功率曲线散点数据集{PCi}的最终离群点判别结果集{Outlier},作为最终离群点判别结果;所述最终离群点判断准则定义为:对于功率曲线散点数据集{PCi}中的任一数据点Q′,若其在归一化功率曲线散点数据集{PCnorm,i}中对应的数据点Q是某风速区间的真实离群点或某功率区间的真实离群点,则点Q′为功率曲线散点数据集{PCi}的最终离群点。2.根据权利要求1所述的一种面向风电机组功率曲线数据的离群点判别方法,其特征在于,所述步骤2)中,信息数据集进行的数据预处理操作流程如下:2-a)基于信息数据集记为中的风电机组运行状态{Condi}信息进行异常运行状况检测并剔除异常点,记剔除异常点后的风电机组运行数据集为2-b)利用步骤2-a)中的风电机组运行数据集为计算得出相应时刻的空气密度集{ρi},并将风电机组运行数据集中的风速{vi}修正替换为参考空气密度ρ0下的修正风速并记新数据集为风电机组正常数据集{Xi}。3.根据权利要求2所述的一种面向风电机组功率曲线数据的离群点判别方法,其特征在于,所述步骤2-a)中,利用信息数据集记为中的信息进行异常运行状况检测,具体检测判据如下:表1风电机组异常运行状况检测判据其中Condnormal为风电机组正常运行状态,Condls为风电机组低风速正常运行状态,Condhs为风电机组高风速正常运行状态,Prated为风电机组额定有功功率,Pthres为有功功率阈值,βthres为桨距角阈值。4.根据权利要求2所述的一种面向风电机组功率曲线数据的离群点判别方法,其特征在于,所述步骤2-b)中,空气密度ρi以及修正风速的计算公式如下:2-b-a)空气密度ρi:其中R0为干燥空气的比气体常数;Rw为水蒸气的比气体常数;Pw为水蒸气的气压;Bi为环境气压,通过SCADA系统获取,或者通过估计,其中B0为标准海平面大气压强,e为自然常数,g为重力加速度,z为风电机组轮毂处海拔高度,R为空气的比气体常数;为相对环境湿度,通过SCADA系统获取,或者设置2-b-b)修正风速其中ρ0为参考空气密度。5.根据权利要求1所述的一种面向风电机组功率曲线数据的离群点判别方法,其特征在于,所述步骤4)中,利用最大值最小值标准化方法对数据进行归一化,具体流程如下:4-a)确定功率曲线散点数据集{PCi}中风速信息以及功率信息{Pi}的最大值与最小值,记风速信息的最大值为vmax,最小值为vmin;功率信息{Pi}的最大值为Pmax,最小值为Pmin;4-b)利用如下公式计算标准化后的风速信息以及标准化后的功率信息{Pnorm,i}:4-c)将标准化风速信息以及标准化功率信息{Pnorm,i}合成为归一化功率曲线散点数据集{PCnorm,i},即6.根据权利要求1所述的一种面向风电机组功率曲线数据的离群点判别方法,其特征在于,所述步骤5)中,归一化功率曲线散点数据集{PCnorm,i}的划分方法具体如下:5-a)确定归一化功率曲线散点数据集{PCnorm,i}的区间划分个数M;5-b)以为划分间隔,将数据集{PCnorm,i}按照风速进行均匀划分,则第j个风速区间的归一化功率曲线...
【专利技术属性】
技术研发人员:杨秦敏,鲍雨浓,陈积明,孙优贤,
申请(专利权)人:浙江大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。