【技术实现步骤摘要】
风机特性数据的离群点清洗方法、装置和计算机设备
[0001]本申请涉及数据分析与处理
,特别是涉及一种离群点清洗方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
[0002]风能作为主要的可再生能源之一,其重要性不容忽视。目前,风电场通过监视控制与数据采集(SCADA)系统实现对风速、功率和其他状态参数的采集。但是,该系统采集到的运行数据中总是存在着大量的异常数据,导致风速
‑
功率,转速
‑
功率和风速
‑
转速等风电机组特性曲线散点图中存在许多的离群点。降低这些离群点不利影响的有效方法就是使用恰当的数据清洗技术对离群点进行识别和清除。
[0003]目前的风机特性数据的离群点清洗方法通过假设数据区间内的数据点分布为正态分布,实现对风电机组特性数据中异常数据的清洗。
[0004]然而,实际情况中风机特性数据的数据区间内的数据点分布并非正态分布,即目前的风机特性数据的离群点清洗方法与风机特性数据的实际情况不符。因此,目前的风机特性数据的离群点清洗 ...
【技术保护点】
【技术特征摘要】
1.一种风机特性数据的离群点清洗方法,其特征在于,所述方法包括:获取风机特性数据;所述风机特性数据为包含第一风机参数和第二风机参数的二维数据;根据所述风机特性数据和预设的第一风机参数区间的数量,确定各第一风机参数区间对应的风机特性数据;针对每一个第一风机参数区间,根据所述第一风机参数区间对应的风机特性数据,采用核密度估计法,确定所述第一风机参数区间内所述第二风机参数对应的风机概率密度分布曲线;根据所述风机概率密度分布曲线和预设的主峰阈值,确定所述第一风机参数区间对应的主峰区间,并根据所述第一风机参数区间对应的风机特性数据和所述主峰区间,确定所述第一风机参数区间对应的清洗结果;所述主峰区间为第二风机参数区间;将各所述第一风机参数区间对应的清洗结果合并,得到所述风机特性数据的清洗结果。2.根据权利要求1所述的方法,其特征在于,所述根据所述风机概率密度分布曲线和预设的主峰阈值,确定所述第一风机参数区间对应的主峰区间包括:根据所述风机概率密度分布曲线和预设的主峰阈值,确定所述第一风机参数区间对应的峰谷区间;根据所述风机概率密度分布曲线、所述峰谷区间和预设的边界阈值,确定所述第一风机参数区间对应的主峰区间。3.根据权利要求2所述的方法,其特征在于,所述根据所述风机概率密度分布曲线、所述峰谷区间和预设的边界阈值,确定所述第一风机参数区间对应的主峰区间包括:根据所述风机概率密度分布曲线、所述峰谷区间和预设的边界阈值,确定所述第一风机参数区间对应的边界区间;根据所述边界区间和预设的延展系数,确定所述第一风机参数区间对应的主峰区间。4.根据权利要求2所述的方法,其特征在于,所述根据所述风机概率密度分布曲线和预设的主峰阈值,确定所述第一风机参数区间对应的峰谷区间包括:根据所述风机概率密度分布曲线,确定所述风机概率密度分布曲线的极大值对应的第一风机参数的第一集合和极小值对应的第一风机参数的第二集合;根据所述第一集合、所述第二集合和预设的主峰阈值,确定波峰第二风机参数和波谷第二风机参数;根据所述波峰第二风机参数和所述波谷第二风机参数,确定所述第一风机参数区间对应的峰谷区间。5.根据权利要求1所述的方法,其特征在于,所述根据所述风机特性数据和预设的第一风机参数区间的数量,确定各第一风机参数区间对应的风机特性数据包括:根据预设...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。