当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于异常点及离群点检测的风机功率曲线数据预处理方法技术

技术编号:18238371 阅读:58 留言:0更新日期:2018-06-17 01:54
本发明专利技术公开了一种基于异常点及离群点检测的风机功率曲线数据预处理方法。该方法基于包括风速、有功功率、环境温度以及桨距角等在内的风机数据采集与监视控制(SCADA)系统获得的实时运行数据,使用异常点检测判据进行异常数据清洗,利用计算得到的空气密度对风速数据进行修正,使用离群点检测算法检测并剔除风机功率曲线数据中的离群点。在本数据预处理方法中,异常点检测判据保证了风机数据信息的有效性;风速的修正保证了风机数据的可比性;离群点检测算法保证了最终功率曲线数据的可靠性。本发明专利技术方法基于数据驱动,对数据无特殊要求,普适性较强。与现有技术相比,数据可信程度更高,流程更为规范,具有较强的理论性与实用性。 1

A preprocessing method for fan power curve data based on Outliers Detection and outlier detection

The invention discloses a preprocessing method for fan power curve data based on Outliers Detection and outlier detection. The method is based on the real-time data obtained from the data acquisition and monitoring control (SCADA) system of the fan, which includes wind speed, active power, ambient temperature and pitch angle. The anomaly detection criterion is used to clean the abnormal data. The wind velocity data is corrected by the calculated air density, and the outlier detection is used. The algorithm detects and eliminates outliers in the fan power curve data. In this preprocessing method, the criterion of outlier detection ensures the validity of the fan data information, and the correction of wind speed ensures the comparability of the fan data, and the outlier detection algorithm ensures the reliability of the final power curve data. The method of the invention is based on data driven, and has no special requirement for data, and has strong universality. Compared with the existing technology, the data is more credible, the process is more standardized, and has strong theoretical and practical significance. One

【技术实现步骤摘要】
一种基于异常点及离群点检测的风机功率曲线数据预处理方法
本专利技术涉及一种风机功率曲线数据预处理方法,特别涉及一种基于异常点及离群点检测的风机功率曲线数据预处理方法。
技术介绍
在传统化石能源资源匮乏和污染严重的现代社会,风能作为一种无污染、可再生的新能源而广泛为大众所青睐,风电产业也由此成为国内外大力发展的新型可再生能源产业之一。在我国,近十年来有关风电场的建设与相关研究工作无论是从数量上还是质量上来说都有着显著的提升,但在大力发展风力发电行业的同时,也伴随着风机自身的不断退化所导致的一系列负面因素。现今风力发电机在使用的过程中,由于风速具有间歇性与高度不确定性的特点,对风力发电机本身的性能评估造成了较大的影响,而正确对风力发电机的性能与健康状况进行评估与诊断则是风力发电运维方面合理规划的重要之处。考虑到风机在正常工作中,其不同情况下额故障大多数都会反映在风机的功率曲线中,因此对于风机功率曲线的准确获取是当前研究风机性能状况方面问题的潜在基础。而对于风机的功率曲线获取而言,如何将包含异常甚至错误的数据集信息转变为有效的、统一的、可靠的数据信息则是获取风机真实功率曲线的重中之重。然而,目前现有的功率曲线获取方法在数据预处理方面主要存在着以下几类不足之处:(1)传统的功率曲线获取方法中未形成针对风机运行数据的数据清洗规范流程;(2)在研究过程中直接分析不同工况下的全部数据,导致后续数据分析结果不准确;(3)仅依赖故障检测系统的反馈进行故障数据的判断,无法排除潜在故障的影响。因此,现有的功率曲线获取技术在数据预处理方面无法从数据集中有效地获取到风机功率曲线的可靠信息,需要进行相应的流程规范化改进。
技术实现思路
本专利技术目的在于对现有研究和技术存在的不足之处加以完善与规范化,提出一种基于异常点及离群点检测的风机功率曲线数据预处理方法。该方法对风电场风机功率曲线方法添加更加规范的数据预处理流程,可以提高获取功率曲线的准确性与可靠性,更具有实用价值;且有利于通过数据分析对潜在故障进行检测,方法应用的扩展性高。本专利技术的目的通过以下的技术方案实现:一种基于异常点及离群点检测的风机功率曲线数据预处理方法,该方法包括以下步骤:1)根据待评估风机功率曲线获取需求,读取相应需求周期内总计N条待评估风机的SCADA系统中测量得到的风机运行数据信息,该信息包含风速{vi}、有功功率{Pi}、桨距角{βi}以及环境温度{Ti},将信息数据集记为其中i=1,2,3,…,N;2)对步骤1)中的数据集进行异常点检测,并剔除异常点,保留余下不符合异常点特征的总计Nnormal条运行数据作为风机标准运行数据集其中i=1,2,3,…,Nnormal;3)利用步骤2)中标准运行数据集计算得出相应时刻空气密度集{ρi},将标准运行数据集中的风速{vi}修正为参考空气密度ρ0下的修正风速4)将步骤3)中修正后的标准运行数据集中的修正风速以及有功功率{Pi}合成功率曲线数据集{PCi},并以一定的风速间隔将功率曲线数据集{PCi}划分为M个区间,并记第k个区间的数据个数为Nk、功率曲线数据集为其中k=1,2,3,…,M,i=1,2,3,…,Nk;5)分别对步骤4)中划分得到的每个区间的数据集进行标准差标准化,并对各个区间进行离群点检测,剔除离群点,然后进行标准差标准化还原;6)将步骤5)中还原后的每个区间的数据集进行合并,得到最终功率曲线数据集作为预处理后的风机功率曲线数据。作为更进一步描述,所述方法步骤2)中,利用基于时间序列的风机功率曲线异常点判据进行异常点检测,包括两种情况:情况1:根据风速{vi}、有功功率{Pi}、桨距角{βi}定义基于时间序列的风机功率曲线异常点判据,如下表3所示:表3风机功率异常点基础判断准则(仅基于基础信息)其中Prated为风机额定有功功率,vcut_in为风机切入风速,vrated为风机额定风速,vcut_off为风机切出风速,Pthres为有功功率阈值,βthres为桨距角阈值。情况2:通过SCADA系统获取风机状态{Condi},根据风速{vi}、有功功率{Pi}、桨距角{βi}以及风机状态{Condi}定义基于时间序列的风机功率曲线异常点判据,如下表4所示:表4风机功率异常点改进判断准则(基于SCADA系统风机状态信息)其中Condnormal为风机正常运行状态,Condls为风机低风速正常运行状态,Condhs为风机高风速正常运行状态,Prated为风机额定有功功率,vcut_in为风机切入风速,Pthres为有功功率阈值,βthres为桨距角阈值。作为更进一步描述,所述方法步骤3)中的空气密度ρi以及修正风速的计算公式如下:a)空气密度ρi:其中R0为干燥空气的比气体常数;Rw为水蒸气的比气体常数;Pw为水蒸气的气压;Bi为环境气压,通过SCADA系统获取,或者通过估计,其中B0为标准海平面大气压强,e为自然常数,g为重力加速度,z为风机轮毂处海拔高度,R为空气的比气体常数;为相对环境湿度,通过SCADA系统获取,或者设置b)修正风速其中ρ0为参考空气密度。作为更进一步描述,所述方法步骤4)中数据集{PCi}的区间划分方法如下:a)确定数据集{PCi}中的修正风速中的最大值并记其中vcut_off为风机切出风速;b)确定划分区间数M,则第k个区间的功率曲线数据集定义为其中为第k个区间的风速范围上界,同时为第k+1个区间的风速范围下界,其计算公式为此外,分别表示第1个区间的下界以及第M个区间的上界。作为更进一步描述,所述方法步骤5)中,每个区间数据集的标准差标准化公式如下:其中分别对应区间内的第i个标准差标准化风速以及有功功率数据,分别为对应区间内修正风速以及有功功率{Pi}的均值,σv,σP分别为对应区间内修正风速以及有功功率{Pi}的标准差。作为更进一步描述,所述方法步骤5)中,通过k近邻(kNN)离群点检测算法对各个区间进行离群点检测,具体为:a)确定特定区间的离群点数量ni以及衡量距离点的个数Ki;b)记第i条数据为xi,针对区间内每一条数据xi,分别计算与其他数据xj之间的距离disti,j,计算公式如下其中分别为对应区间内的第i个标准差标准化风速以及有功功率;c)对第i条数据到其他数据xj之间的距离disti,j由小到大进行排序,选出其中距离最小的Ki个距离,将其累加作为第i条数据的k近邻距离kdisti;d)将该区间的所有数据的k近邻距离kdisti全部计算之后,从中选取最大的ni个值,其所对应的ni条数据则被视为该区间的离群点并剔除;e)分别对所有M个区间重复以上步骤a)至步骤d),直到所有区间的离群点均被检测完毕并剔除。与现有技术相比,本专利技术具有以下创新优势及显著效果:1)针对风机功率曲线获取方法中风机运行数据集异常值的特征设计了数据预处理的规范性流程,为后续数据分析方法建立数据可靠性与规范性方面的优势;2)针对风机运行数据在不同工况下进行采集的特点,采用数据修正计算的方式将数据转换至同工况数据进行比较分析,提高了数据分析研究过程中的准确率,也使得后续数据分析处理的结果与相关应用更符合真实情况,具有较强的实用性;3)针对风机数据集修正前后的相关统计特征,利用基于kNN的离群点检测方本文档来自技高网
...
一种基于异常点及离群点检测的风机功率曲线数据预处理方法

【技术保护点】
1.一种基于异常点及离群点检测的风机功率曲线数据预处理方法,其特征在于,包括

【技术特征摘要】
1.一种基于异常点及离群点检测的风机功率曲线数据预处理方法,其特征在于,包括以下步骤:1)根据待评估风机功率曲线获取需求,读取相应需求周期内总计N条待评估风机的SCADA系统中测量得到的风机运行数据信息,该信息包含风速{vi}、有功功率{Pi}、桨距角{βi}以及环境温度{Ti},将信息数据集记为其中i=1,2,3,…,N;2)对步骤1)中的数据集进行异常点检测,并剔除异常点,保留余下不符合异常点特征的总计Nnormal条运行数据作为风机标准运行数据集其中i=1,2,3,…,Nnormal;3)利用步骤2)中标准运行数据集计算得出相应时刻空气密度集{ρi},将标准运行数据集中的风速{vi}修正为参考空气密度ρ0下的修正风速4)将步骤3)中修正后的标准运行数据集中的修正风速以及有功功率{Pi}合成功率曲线数据集{PCi},并以一定的风速间隔将功率曲线数据集{PCi}划分为M个区间,记第k个区间的数据个数为Nk、功率曲线数据集为其中k=1,2,3,…,M,i=1,2,3,…,Nk;5)分别对步骤4)中划分得到的每个区间的数据集进行标准差标准化,并对各个区间进行离群点检测,剔除离群点,然后进行标准差标准化还原;6)将步骤5)中还原后的每个区间的数据集进行合并,得到最终功率曲线数据集作为预处理后的风机功率曲线数据。2.根据权利要求1所述的一种基于异常点及离群点检测的风机功率曲线数据预处理方法,其特征在于,所述步骤2)中,利用基于时间序列的风机功率曲线异常点判据进行异常点检测,包括两种情况:情况1:根据风速{vi}、有功功率{Pi}以及桨距角{βi}定义基于时间序列的风机功率曲线异常点判据,如下表1所示:表1风机功率曲线异常点基础判据其中Prated为风机额定有功功率,vcut_in为风机切入风速,vrated为风机额定风速,vcut_off为风机切出风速,Pthres为有功功率阈值,βthres为桨距角阈值。情况2:通过SCADA系统获取风机状态{Condi},根据风速{vi}、有功功率{Pi}、桨距角{βi}以及风机状态{Condi}定义基于时间序列的风机功率曲线异常点判据,如下表2所示:表2风机功率曲线异常点改进判据其中Condnormal为风机正常运行状态,Condls为风机低风速正常运行状态,Condhs为风机高风速正常运行状态,Prated为风机额定有功功率,vcut_in为风机切入风速,Pthre...

【专利技术属性】
技术研发人员:杨秦敏鲍雨浓王旭东林巍陈积明
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1