基于Borderline SMOTE的电力变压器故障样本均衡化和故障诊断方法技术

技术编号:26067252 阅读:67 留言:0更新日期:2020-10-28 16:40
本发明专利技术公开了一种基于Borderline SMOTE的电力变压器故障样本均衡化和故障诊断方法,均衡化方法包括搜索少数类样本、分类少数样本、生成新样本步骤,故障诊断方法还包括故障诊断步骤。本发明专利技术增加了边界样本附近的少数样本,降低了边界样本的误判率,从而提高了分类准确性;适用于多种人工智能算法对非均衡数据集的处理,可直接移植和扩展到分类算法中,具有较强的普适性和泛化性。

【技术实现步骤摘要】
基于BorderlineSMOTE的电力变压器故障样本均衡化和故障诊断方法
本专利技术涉及一种电力变压器故障样本均衡化和故障诊断方法,尤其涉及一种基于BorderlineSMOTE的电力变压器故障样本均衡化和故障诊断方法,属于变压器故障诊断

技术介绍
利用机器学习等人工智能技术对电力设备大数据深度挖掘和分析是智能运维领域的大势所趋。电力变压器作为电力系统中重要电气设备之一,掌握其运行状态对提高电力变压器运行维护水平,确保电网安全运行均具有重要意义。由于电力变压器非正常状态样本极少,同时故障案例与异常样本信息存在缺失、不完善等问题,导致变压器样本数据集的类别数量分布不均衡。非均衡数据集的类别数量分布极端不均衡,在机器学习模型进行分类任务的分析预测,会出现过拟合、欠拟合等问题,极大降低了机器学习模型的准确性和鲁棒性,给电力系统,乃至社会经济和生活带来重大的损失。合成少数类过采样(syntheticminorityover-samplingtechnique,SMOTE)过线性插值的方法来生成新的少数类样本,添加到原始数据集中,增加少数类样本数量,在一定程度上避免了欠采样中出现的过拟合问题。但是它在进行线性插值时对所有的少数类样本点一视同仁,因而使处于边界位置的少数类样本点更容易被错分。因此,提出了强调边界信息和特征的BorderlineSMOTE算法。将BorderlineSMOTE算法用于电力变压器故障样本均衡化处理,将提高电力变压器故障分析的准确性和鲁棒性。
技术实现思路
>本专利技术要解决的技术问题是提供一种基于BorderlineSMOTE的电力变压器故障样本均衡化方法。为解决上述技术问题,本专利技术采用的技术方案是:技术方案一:一种基于BorderlineSMOTE的电力变压器故障样本均衡化方法,包括以下步骤:步骤1:搜索少数类样本:N为整个数据集,S为少数类样本集,L为多数类样本集;对S中的每一个样本Si,在整个数据集N中搜索得到Si的近邻样本数为m,其中属于少数类样本的数量为mi;步骤2:分类少数类样本:若mi=0,则Si为噪声样本;若mi>k,k为分类阈值,则Si为安全样本;若0<mi≤k,则Si为危险样本;将危险样本Si置入危险集D中;步骤3:生成新样本:对危险集D中的每个样本,通过SMOTE算法线性插值生成新样本。进一步,分类少数类样本的方法为:若mi=0,则Si为噪声样本;若mi>m/2,则Si为安全样本;若0<mi≤m/2,则Si为危险样本。技术方案二:一种根据技术方案一所述的基于BorderlineSMOTE的电力变压器故障样本均衡化方法的故障诊断方法,包括故障诊断步骤:用DNN训练经过BorderlineSMOTE的电力变压器故障样本均衡化方法处理过的数据进行故障诊断。采用上述技术方案所取得的技术效果在于:1、本专利技术增加了边界样本附近的少数样本,降低了边界样本的误判率,从而提高了分类准确性;2、本专利技术在保持原始数据集的样本分布的前提下,尽可能模拟出与边界样本点分布规律和变化趋势一致的样本,并只针对分类边界上容易错分的故障样本的采样,保证了合成数据后依然满足原始数据的分布规律,保留了原始数据的信息和特征,包括故障演化的信息;3、本专利技术不是通过单纯的复制少数类样本来平衡数据集,避免了分类器过拟合等问题,提升了样本数量,丰富了模型从训练数据中提取的特征信息,使得分类器对故障样本关注度增加,对其具有更大的泛化空间;4、本专利技术适用于多种人工智能算法对非均衡数据集的处理,可直接移植和扩展到分类算法中,具有较强的普适性和泛化性。附图说明下面结合附图和具体实施方式对本专利技术作进一步详细的说明。图1是本专利技术的流程图;图2是放电兼过热的数据采样图。具体实施方式实施例1:一种基于BorderlineSMOTE的电力变压器故障样本均衡化方法,包括以下步骤:步骤1:搜索少数类样本:N为整个数据集,S为少数类样本集,L为多数类样本集;对S中的每一个样本Si,在整个数据集N中搜索得到Si的近邻样本数为m,其中属于少数类样本的数量为mi;步骤2:分类少数类样本:若mi=0,则Si为噪声样本;若mi>k,k为分类阈值,则Si为安全样本;若0<mi≤k,则Si为危险样本;将危险样本Si置入危险集D中;步骤3:生成新样本:对危险集D中的每个样本,通过SMOTE算法线性插值生成新样本。进一步,分类少数类样本的方法为:若mi=0,则Si为噪声样本;若mi>m/2,则Si为安全样本;若0<mi≤m/2,则Si为危险样本。本实施例的样本集为电力变压器的油中溶解气体数据,对其故障数据集进行处理,针对7种不同故障类型:低温过热、中温过热、高温过热、局部放电、低能量放电、高能量放电和放电兼过热,分别得出BorderlineSMOTE采样前后的7种数据分布。放电兼过热的数据分布结合了过热和放电故障的特征信息,具有代表性,图2展示了放电兼过热的采样结果。图2为3维数据可视化图,采样数据通过PCA对数据进行了降维,其中x,y,z轴分别代表的是主成分1、主成分2、主成分3。可以看出,BorderlineSMOTE采样前后油色谱数据的分布特征相似、变化趋势一致。其中,原始数据分布密集的地方采样后仍较为密集;原始数据为离散点时,BorderlineSMOTE首先判断是否为边界点,然后在其附近进行过采样。BorderlineSMOTE通过边界样本判断法则,提高了数据可识性。因此,我们认为BorderlineSMOTE采样结果是较为准确、真实、全面的,其很好的保留了原始数据的信息和特征。实施例2:一种根据技术方案一所述的基于BorderlineSMOTE的电力变压器故障样本均衡化方法的故障诊断方法,包括故障诊断步骤:用DNN训练经过BorderlineSMOTE的电力变压器故障样本均衡化方法处理过的数据进行故障诊断。选用适用于不平衡数据分类的评价指标,取几何平均值、宏F1、微F1、平均精度作为分类器的评价指标,记为αG-mean、αF1、αmacro-F1、αmicro-F1、αb-score。对比未均衡化和采用BorderlineSMOTE均衡化后的变压器故障诊断效果,变压器故障诊断的效果对比表1所示。由表1可知,采用BorderlineSMOTE算法之后,其各项指标均有较大的提升,相较于采用非均衡数据集的变压器故障分类,整体分类准确率αmacro-F1提升了17.5%,平均精度αb-score提高了近24%,这表明该方法能够很好的处理变压器故障数据集的不平衡性问题,提高了分类算法对故障样本的识别能力和整体的分类准确率。同时该算法适用于多种人工智能算法对非均衡数据集的处理,可直接移植和扩展到分类算法中,具有较强的普适性和泛化性。实际使用中,将不平衡数据集进行标准化处理后输入Bo本文档来自技高网...

【技术保护点】
1.一种基于Borderline SMOTE的电力变压器故障样本均衡化方法,包括以下步骤:/n步骤1:搜索少数类样本:N为整个数据集,S为少数类样本集,L为多数类样本集;对S中的每一个样本S

【技术特征摘要】
1.一种基于BorderlineSMOTE的电力变压器故障样本均衡化方法,包括以下步骤:
步骤1:搜索少数类样本:N为整个数据集,S为少数类样本集,L为多数类样本集;对S中的每一个样本Si,在整个数据集N中搜索得到Si的近邻样本数为m,其中属于少数类样本的数量为mi;
步骤2:分类少数类样本:若mi=0,则Si为噪声样本;若mi>k,k为分类阈值,则Si为安全样本;若0<mi≤k,则Si为危险样本;将危险样本Si置入危险集D中;
步骤3:生成新样本:对危险集D中的每个样本,通过SMOTE算法线性插值生成新样本...

【专利技术属性】
技术研发人员:刘云鹏和家慧刘一瑾
申请(专利权)人:华北电力大学保定
类型:发明
国别省市:河北;13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1