System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于自适应K-means分段和边界建模的风功率异常数据识别方法技术_技高网

一种基于自适应K-means分段和边界建模的风功率异常数据识别方法技术

技术编号:44103656 阅读:16 留言:0更新日期:2025-01-24 22:31
本发明专利技术提供一种基于自适应K‑means分段和边界建模的风功率异常数据识别方法,包括:根据底部堆积型异常数据的功率值小于0的特征通过规则筛选的方式识别并滤除风功率数据集中的底部堆积型异常数据;利用CH指数和k‑means算法将规则筛选后的风功率数据集自适应地划分为K个不重叠的簇;将步骤S3得到的各个簇分别按功率值划分为L个区间,并计算每个功率区间对应的风速范围数据和风速均值数据;根据每个功率区间对应的风速范围数据和风速均值数据利用峰值修正结合边界建模识别出离散型异常数据和限功率型异常数据。本发明专利技术提高了风功率异常数据的识别准确率。

【技术实现步骤摘要】

本专利技术属于风电,特别是涉及一种基于自适应k-means分段和边界建模的风功率异常数据识别方法。


技术介绍

1、目前,风功率异常数据的处理方法主要分为基于机器学习的方法、基于统计学分析的方法和基于图像分析的方法等。

2、基于机器学习的风功率异常数据处理方法的基本思想是通过训练模型来学习风功率数据的正常模式,然后利用训练模型来识别和处理异常数据。现有的机器学习方法尝试采用最近邻居算法(knn)构建风速功率曲线对异常数据进行在线检测;有些学者通过k-means算法识别异常数据,通过二次聚类方法解决k-means算法中k值的选取问题;另外,利用数据间的相似性关系,采用支持向量机建立多台机组邻近模型识别异常数据也被一些学者采用;机器学习相关算法具有的共同缺点是当待识别数据存在大量限功率型异常数据时会出现识别失败的情况,同时,基于机器学习的方法往往含有需要根据不同数据集人工调整的参数,不同的参数设置往往会带来完全不同的结果,难以得到一种合适的参数选择法。

3、基于统计学分析的风功率异常数据处理方法的基本思想是通过统计分析来检测和处理异常,根据数据的统计性质和分布特征,利用概率和假设检验等统计方法来判断数据是否异常。目前,基于统计学分析的方法主要包括3-σ准则、四分位法和copula函数等。这类方法虽然考虑到限功率型异常数据,但是,该类方法往往需要对数据分区,导致识别结果呈现锯齿状,会有大量正常数据被错误地识别为异常数据。


技术实现思路

1、为了解决
技术介绍
中存在的问题,以针对不同类型数据自身独特的特征,采用不同的方法进行识别和清洗,以提高风功率异常数据的识别准确率,为此本专利技术提供一种基于自适应k-means分段和边界建模的风功率异常数据识别方法,包括:

2、s1:针对不同风功率异常数据的分布特征将风功率异常数据划分为底部堆积型异常数据、离散型异常数据和限功率型异常数据;其中,底部堆积型异常数据为功率值小于0的风功率异常数据;

3、s2:根据底部堆积型异常数据的功率值小于0的特征通过规则筛选的方式识别并滤除风功率数据集中的底部堆积型异常数据;

4、s3:利用ch指数和k-means算法将规则筛选后的风功率数据集自适应地划分为k个不重叠的簇;

5、s4:将步骤s3得到的各个簇分别按功率值划分为l个区间,并计算每个功率区间对应的风速范围数据和风速均值数据;

6、s5:根据每个功率区间对应的风速范围数据和风速均值数据利用峰值修正结合边界建模识别出离散型异常数据和限功率型异常数据。

7、优选地,所述步骤s3包括:

8、s31:对于给定的k值,使用k-means算法对风功率数据集进行聚类,并计算聚类后的ch指数;

9、s32:通过尝试不同的k值,比较它们对应的ch指数,选择ch指数最高的k值作为最优的k值,并得到最优k值对应的k个簇。

10、优选地,所述ch指数包括:

11、

12、

13、

14、其中,tr()表示求矩阵的迹;bk表示簇间数据的协方差矩阵;wk表示簇内数据的协方差矩阵;n表示所有簇中数据的总数,k表示簇的个数;nq表示第q个簇中数据的总数;rq表示第q个簇的数据中心点,rq表示第q个簇;re表示所有簇的数据中心点;x∈rq表示第q个簇中的数据点。

15、优选地,所述计算每个功率区间对应的风速范围数据和风速均值数据包括:

16、利用四分位法计算每个功率区间对应的风功率数据的风速范围,得到每个功率区间对应的风速范围数据(pc,wr),计算公式如下:

17、wr=qu-ql+3iqr=4iqr

18、iqr=qu-ql

19、其中,wr表示功率区间对应的风功率数据的风速范围;qu表示功率区间对应的前25%位置风功率数据的风速值;ql表示功率区间对应的后25%位置风功率数据的风速值;pc表示功率区间的中心点;

20、所述每个功率区间对应的风速均值数据为(pc,wm),wm表示每个功率区间对应的风功率数据的风速均值。

21、优选地,所述步骤s5包括:

22、s51:将每个功率区间对应的风速范围数据和风速均值数据分别构建为风速范围数据点集和风速均值数据点集;

23、s52:针对风速范围数据点集和风速均值数据点集分别提取风速范围数据点集的峰值数据和风速均值数据点集的峰值数据;其中,所述峰值数据包括:峰值的凸起程度,峰值的起点和峰值的终点;

24、s53:遍历风速范围数据点集的峰值数据和风速均值数据点集的峰值数据,当峰值的凸起程度大于设定阈值时,则该峰值的起点到终点的数据点利用线性插补法进行修正,得到修正后的风速范围数据点集和风速均值数据点集;

25、s54:利用指数函数对修正后的风速范围数据点集进行拟合得到风速范围曲线;利用三次函数对修正后的风速均值数据点集进行拟合得到风速均值曲线;

26、s55:根据风速范围曲线和风速均值曲线设置左边界阈值和右边界阈值,基于设定的左边界阈值和右边界阈值对风功率数据集中的离散型异常数据和限功率型异常数据进行识别。

27、优选地,所述提取风速范围数据点集的峰值数据和风速均值数据点集的峰值数据包括:

28、s521:遍历数据集中的每个数据点yz=(pz,wz),z表示第z个数据点,pz表示数据点yz对应的功率,wz表示数据点yz对应的风速范围或风速均值,比较数据点pz与其相邻数据点的大小,若wz>wz+1且wz>wz-1,则将数据点yz加入峰值点集合;

29、s522:遍历峰值点集合中的每个峰值点yp,从峰值点yp出发,在数据集中沿峰值点yp左右两侧同步进行扩展,计算峰值点yp到直线l的最短距离,其中,直线l由沿峰值点yp左侧扩展得到的点ps和沿峰值点yp右侧扩展得到的点pe相连构成;

30、s523:当峰值点yp到直线l的最短距离大于峰值点yp对应峰值的凸起程度pm,则将点ps和点pe作为峰值点yp对应峰值的起点和终点;其中,所述峰值点yp对应峰值的凸起程度pm包括:

31、pm=wp-min(ws,we)

32、其中,wp表示峰值点yp对应的风速范围或风速均值;ws表示数据点ps对应的风速范围或风速均值;pe表示数据点pe对应的风速范围或风速均值。

33、优选地,所述指数函数包括:

34、

35、其中,x表示功率,w(x)表示风速范围,a2、b2和c2表示参数。

36、优选地,所述三次函数包括:

37、v(x)=a1x3+b1x2+c1x+d1

38、其中,x表示功率,v(x)表示风速范围,a1、b1、c1和d1表示参数。

39、优选地,所述左边界阈值为v(x)-0.5w(x),所述右边界阈值为v(x)+0.5w(x)。...

【技术保护点】

1.一种基于自适应K-means分段和边界建模的风功率异常数据识别方法,其特征在于,包括:

2.根据权利要求1所述的一种基于自适应K-means分段和边界建模的风功率异常数据识别方法,其特征在于,所述步骤S3包括:

3.根据权利要求2所述的一种基于自适应K-means分段和边界建模的风功率异常数据识别方法,其特征在于,所述CH指数包括:

4.根据权利要求2所述的一种基于自适应K-means分段和边界建模的风功率异常数据识别方法,其特征在于,所述计算每个功率区间对应的风速范围数据和风速均值数据包括:

5.根据权利要求1所述的一种基于自适应K-means分段和边界建模的风功率异常数据识别方法,其特征在于,所述步骤S5包括:

6.根据权利要求5所述的一种基于自适应K-means分段和边界建模的风功率异常数据识别方法,其特征在于,所述提取风速范围数据点集的峰值数据和风速均值数据点集的峰值数据包括:

7.根据权利要求5所述的一种基于自适应K-means分段和边界建模的风功率异常数据识别方法,其特征在于,所述指数函数包括

8.根据权利要求7所述的一种基于自适应K-means分段和边界建模的风功率异常数据识别方法,其特征在于,所述三次函数包括:

9.根据权利要求8所述的一种基于自适应K-means分段和边界建模的风功率异常数据识别方法,其特征在于,所述左边界阈值为v(x)-0.5w(x),所述右边界阈值为v(x)+0.5w(x)。

...

【技术特征摘要】

1.一种基于自适应k-means分段和边界建模的风功率异常数据识别方法,其特征在于,包括:

2.根据权利要求1所述的一种基于自适应k-means分段和边界建模的风功率异常数据识别方法,其特征在于,所述步骤s3包括:

3.根据权利要求2所述的一种基于自适应k-means分段和边界建模的风功率异常数据识别方法,其特征在于,所述ch指数包括:

4.根据权利要求2所述的一种基于自适应k-means分段和边界建模的风功率异常数据识别方法,其特征在于,所述计算每个功率区间对应的风速范围数据和风速均值数据包括:

5.根据权利要求1所述的一种基于自适应k-means分段和边界建模的风功率异常数据识别方法,其特征在于,所述步骤s5...

【专利技术属性】
技术研发人员:陈俊生张忠恒刘青松陈沂蒙刘明杰
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1