【技术实现步骤摘要】
一种基于LOF算法的风电站原始风电数据质量控制的方法
[0001]本专利技术涉及数据处理
,具体涉及一种基于LOF算法的风电站原始风电数据质量控制的方法。
技术介绍
[0002]近年来,风能已成为一种主要的能源。以实测风速和功率为基础建立的风电功率曲线可以用于评价风电机组的性能和运行状态。然而,用于风数据采集和传输的传感器常常位于偏远的站点,暴露在开放、不受控制甚至恶劣的环境中,出现错误数据的概率相对较高。目前,风电机组运行数据的收集、管理、分析和挖掘还存在许多不足,采集到的数据比较粗糙,数据质量无法保证。
[0003]由于风速和风向的变化,风电具有波动性、间歇性和随机性等特点,因此数据挖掘的方法相比于传统的统计方法更适合于分析高度非线性的风电数据。
[0004]本文提出一种基于LOF算法的风电站原始风电数据质量控制的方法,以解决上述现有存在的问题。
技术实现思路
[0005]有鉴于此,本专利技术提供一种基于LOF算法的风电站原始风电数据质量控制的方法,提高数据质量控制准确率。
...
【技术保护点】
【技术特征摘要】
1.一种基于LOF算法的风电站原始风电数据质量控制的方法,其特征在于,包括以下步骤:步骤一、收集并整理风电站原始风电数据;步骤二、利用滑动标准差方法识别出受仪器故障影响而出现的连续无变化或者变化很小数据,并将其剔除;步骤三、剔除原始风电数据中缺测的数据;步骤四、根据国家、行业相关标准文件以及风力发电机功率曲线对风速、实际有功功率数据进行数值范围检验,剔除超出合理范围的数据;步骤五、利用归一化方法对数据进行缩放;步骤六、在以上数据的预处理后,计算数据点的第k距离邻域、第k可达距离、局部可达密度以及局部离群因子LOF值;步骤七、将LOF值高于设定阈值的数据点视作异常点,并将异常值剔除。2.根据权利要求1所述的基于LOF算法的风电站原始风电数据质量控制的方法,其特征在于,所述步骤二中,对于无变化或者变化很小数据的剔除,采用5点滑动标准差方法进行识别,其计算公式如(1)所示:其中n=5,识别点为x3,即识别点为5点的中心点;当数据连续无变化时,标准差为0;当数据变化很小时,标准差值也很小。3.根据权利要求1所述的基于LOF算法的风电站原始风电数据质量控制的方法,其特征在于,所述步骤五中,计算公式如(2)所示:其中x为数据原始值,x
′
为数据归一化之后的值,x
max
和x
min
都为样本数据的最大值和最小值。4.根据权利要求1所述的基于LOF算法的风电站原始风电数据质量控制的方法,其特征在于,所述步骤六中,第k距离,定义d
k
(O)为点O的第k距离,d
k
(O)=d(O,...
【专利技术属性】
技术研发人员:冯杉,魏璐,孙睿藻,王丽,李伊吟,程凯琪,
申请(专利权)人:河南省气象服务中心河南省气象影视和宣传中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。