System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于过采样的高压断路器故障数据采样方法技术_技高网

一种基于过采样的高压断路器故障数据采样方法技术

技术编号:41331153 阅读:3 留言:0更新日期:2024-05-20 09:52
本发明专利技术涉及高压断路器故障诊断领域,特别涉及一种基于过采样的高压断路器故障数据采样方法,包括以下步骤:S1、采集高压断路器不平衡监测数据样本集,所述不平衡监测数据样本集包括正常状态类样本集和故障状态类样本集;S2、将正常状态类样本集作为多数类,分别将每个故障状态类样本集作为少数类,实施二分类过采样;S3、对二分类中的少数类进行初步去噪;S4、利用KNN算法确定少数类的边界样本集;S5、合成少数类的新样本;S6、利用欠采样对过采样后的样本集边界去噪。本发明专利技术提供的数据采样方法通过对过采样后的数据进行欠采样二次去噪,达到了使样本边界更加清晰的效果。

【技术实现步骤摘要】

本专利技术涉及高压断路器故障诊断,特别涉及一种基于过采样的高压断路器故障数据采样方法


技术介绍

1、高压断路器是电力系统的关键组件,其在电力系统中起控制(投切负荷)和保护(切断故障)作用。高压断路器一旦发生故障,将直接危害整个电力系统的安全与稳定。

2、现如今,基于机器学习的高压断路器智能故障诊断逐渐得到关注,该诊断方法是利用大量且优质的监测数据来训练诊断模型以实现高效诊断。然而,由于高压断路器本身绝大多数时候处于稳定工作状态,正常样本数据量将远大于故障样本数据,导致不同类别的样本数据严重不平衡。

3、对于样本数据不平衡的问题,在机器学习领域中,往往采用数据欠采样和数据过采样来解决,其中数据欠采样由于会抛弃大量多数类数据,往往会造成偏差很大的模型;数据过采样单纯重复正例,容易造成数据的过拟合。通常认为,数据过采样效果通常优于数据欠采样。

4、smote是一种经典的过采样算法,常常被应用于解决数据不平衡问题,然而由于其选取样本完全随机,往往易造成数据过拟合等问题。一些基于smote的改进算法虽然解决了smote算法的主要问题,但大多只在过采样之前对少数类进行去噪,忽视了过采样后的噪音生成。


技术实现思路

1、本专利技术的目的是提供一种基于过采样的高压断路器故障数据采样方法,以解决上述现有技术存在的问题。

2、本专利技术的上述技术目的是通过以下技术方案得以实现的:

3、一种基于过采样的高压断路器故障数据采样方法,包括以下步骤

4、s1、采集高压断路器不平衡监测数据样本集,所述不平衡监测数据样本集包括正常状态类样本集和故障状态类样本集;

5、s2、将正常状态类样本集作为多数类,分别将每个故障状态类样本集作为少数类,实施二分类过采样;

6、s3、对二分类中的少数类进行初步去噪;

7、s4、利用knn算法确定少数类的边界样本集;

8、s5、合成少数类的新样本;

9、s6、利用欠采样对过采样后的样本集边界去噪。

10、在进一步的实施例中,所述步骤s1中,所述监测数据的提取方式为:以高压断路器的合闸开始时间和合闸结束时间为分界点,将高压断路器的振动信号分为三段,分别计算每个时间段对应的信号能量熵,将每段信号的能量熵组合在一起作为特征向量。

11、在进一步的实施例中,所述步骤s1中,所述故障状态至少包括基座螺栓松动故障、缓冲弹簧疲劳、传动机构故障、合闸弹簧疲劳故障。

12、在进一步的实施例中,所述步骤s3中,所述初步去噪方式为:对于每个故障类样本,根据欧式距离搜索其k近邻数据集,如果所述k近邻数据集中没有该故障类样本,则所述故障类样本为噪声样本,直接删去该噪声样本。

13、在进一步的实施例中,所述步骤s4中,确定边界样本的方式为:对于某个故障类样本,根据欧式距离搜索其k近邻数据集,如果所述k近邻数据集中该故障样本的数量小于k/2,则所述故障类样本为边界样本。

14、在进一步的实施例中,所述步骤s5中,合成新样本的方式为:在故障类边界样本间生成故障类新样本,并且在故障类边界样本和其正常类近邻样本间生成故障类新样本。

15、在进一步的实施例中,所述步骤s5中,对于两个故障类边界样本x1和x2,两者之间生成的新样本为:s1=x1+(x1-x2)×λ1,其中λ1表示区间(0,1)间的一个随机数;对于故障类边界样本x1与其正常类近邻样本y1,两者之间生成的新样本为:s1=x1+(x1-x2)×λ2,其中λ2表示区间(0,0.5)间的一个随机数。

16、在进一步的实施例中,所述步骤s6中,所述去噪方式为:对正常类边界样本集进行smote算法随机过采样,再随机选取其中的样本,与离它最近的一个故障样本配对,然后将这个配对删去。

17、综上所述,本专利技术具有以下有益效果:

18、1.本专利技术的故障数据采样方法通过对过采样后的数据进行欠采样二次去噪,达到了使样本边界更加清晰的效果。

19、2.本专利技术的故障数据采样方法通过利用可靠的多数类样本生成故障类新样本,达到了生成的新样本的质量更高的效果。

本文档来自技高网...

【技术保护点】

1.一种基于过采样的高压断路器故障数据采样方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于过采样的高压断路器故障数据采样方法,其特征在于:所述步骤S1中,所述监测数据的提取方式为:以高压断路器的合闸开始时间和合闸结束时间为分界点,将高压断路器的振动信号分为三段,分别计算每个时间段对应的信号能量熵,将每段信号的能量熵组合在一起作为特征向量。

3.根据权利要求2所述的一种基于过采样的高压断路器故障数据采样方法,其特征在于:所述步骤S1中,所述故障状态至少包括基座螺栓松动故障、缓冲弹簧疲劳、传动机构故障、合闸弹簧疲劳故障。

4.根据权利要求3所述的一种基于过采样的高压断路器故障数据采样方法,其特征在于:所述步骤S3中,所述初步去噪方式为:对于每个故障类样本,根据欧式距离搜索其k近邻数据集,如果所述k近邻数据集中没有该故障类样本,则所述故障类样本为噪声样本,直接删去该噪声样本。

5.根据权利要求4所述的一种基于过采样的高压断路器故障数据采样方法,其特征在于:所述步骤S4中,确定边界样本的方式为:对于某个故障类样本,根据欧式距离搜索其k近邻数据集,如果所述k近邻数据集中该故障样本的数量小于k/2,则所述故障类样本为边界样本。

6.根据权利要求5所述的一种基于过采样的高压断路器故障数据采样方法,其特征在于:所述步骤S5中,合成新样本的方式为:在故障类边界样本间生成故障类新样本,并且在故障类边界样本和其正常类近邻样本间生成故障类新样本。

7.根据权利要求6所述的一种基于过采样的高压断路器故障数据采样方法,其特征在于:所述步骤S5中,对于两个故障类边界样本x1和x2,两者之间生成的新样本为:s1=x1+(x1-x2)×λ1,其中λ1表示区间(0,1)间的一个随机数;对于故障类边界样本x1与其正常类近邻样本y1,两者之间生成的新样本为:s1=x1+(x1-x2)×λ2,其中λ2表示区间(0,0.5)间的一个随机数。

8.根据权利要求7所述的一种基于过采样的高压断路器故障数据采样方法,其特征在于:所述步骤S6中,所述去噪方式为:对正常类边界样本集进行SMOTE算法随机过采样,再随机选取其中的样本,与离它最近的一个故障样本配对,然后将这个配对删去。

...

【技术特征摘要】

1.一种基于过采样的高压断路器故障数据采样方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于过采样的高压断路器故障数据采样方法,其特征在于:所述步骤s1中,所述监测数据的提取方式为:以高压断路器的合闸开始时间和合闸结束时间为分界点,将高压断路器的振动信号分为三段,分别计算每个时间段对应的信号能量熵,将每段信号的能量熵组合在一起作为特征向量。

3.根据权利要求2所述的一种基于过采样的高压断路器故障数据采样方法,其特征在于:所述步骤s1中,所述故障状态至少包括基座螺栓松动故障、缓冲弹簧疲劳、传动机构故障、合闸弹簧疲劳故障。

4.根据权利要求3所述的一种基于过采样的高压断路器故障数据采样方法,其特征在于:所述步骤s3中,所述初步去噪方式为:对于每个故障类样本,根据欧式距离搜索其k近邻数据集,如果所述k近邻数据集中没有该故障类样本,则所述故障类样本为噪声样本,直接删去该噪声样本。

5.根据权利要求4所述的一种基于过采样的高压断路器故障数据采样方法,其特征在于:所述步骤s4中,确定边界样本的方式为:对于某个故障类...

【专利技术属性】
技术研发人员:杜文娇曹彦朝汤振鹏许巧云陈子辉李辰盟邱时严
申请(专利权)人:广东电网有限责任公司江门供电局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1