一种面向不平衡数据集的极限学习机变压器故障诊断方法技术

技术编号:19547144 阅读:24 留言:0更新日期:2018-11-24 21:11
本发明专利技术公开了一种面向不平衡数据集的极限学习机变压器故障诊断方法,具体为,步骤1、将采集的油浸式变压器带有类标签的不平衡样本集S={(x1,t1),(x2,t2)...(xn,tn)}按6:1的比例分为训练样本和测试样本;其中,xi代表样本属性,i=1,2,3,4,5,6,具体包含氢气、甲烷、乙烷、乙烯、乙炔、一氧化碳,六种属性;ti代表类别标签,i=1,2,3,4,5,6,1、2、3、4、5、6分别对应正常状态、中温过热、高温过热、局部放电、火花放电、电弧放电,并用PAM算法对其进行聚类,并用PAM算法对其进行聚类;步骤2、以PAM算法的聚类簇心作为中心点,对于少数类;步骤3、极限学习机分类输出阶段,首先建立DAG‑ELM模型,然后,阶段2产生的新数据集仍按6:1分成训练集和测试集,6份用于训练建模,1份用于验证分类效果。本方法解决了不平衡数据集对变压器故障诊断结果的影响。

A Transformer Fault Diagnosis Method for Extreme Learning Machine Oriented to Unbalanced Data Set

The invention discloses a transformer fault diagnosis method of limit learning machine for unbalanced data sets. The method is as follows: step 1. The unbalanced sample set S={(x1, t1), (x2, t2)... (xn, tn)} of oil-immersed transformer with class label is divided into training sample and test sample according to the ratio of 6:1, in which Xi represents the attribute of the sample, and I. = 1,2,3,4,5,6, specifically including hydrogen, methane, ethane, ethylene, acetylene, carbon monoxide, six attributes; Ti represents the category label, I = 1,2,3,4,5,6, 1, 2, 3, 4, 5, 6 corresponds to the normal state, medium-temperature overheating, high-temperature overheating, partial discharge, spark discharge, arc discharge, and uses PAM. The algorithm clustered them and clustered them with PAM algorithm; Step 2, the cluster center of PAM algorithm was taken as the center point for a few classes; Step 3, in the output stage of extreme learning machine classification, the DAG -ELM model was first established, and then, the new data set generated in stage 2 was still divided into training set and test set according to 6:1, and six of them were used for training set and test set. Training Modeling, 1 copy to verify the classification effect. This method solves the influence of unbalanced data sets on transformer fault diagnosis results.

【技术实现步骤摘要】
一种面向不平衡数据集的极限学习机变压器故障诊断方法
本专利技术属于变压器故障在线监测
,具体涉及一种面向不平衡数据集的极限学习机变压器故障诊断方法。
技术介绍
当前社会高速发展,随之带来的对电网建设的刚性需求,使得全国联网的格局基本形成。电力系统是一个由众多发、送、输、配的用电设备连接而成的大系统,任何设备的故障都将直接影响整个系统的稳定性和安全性。变压器在电力系统中应用广泛,其安全稳定的运行状态关系着电网与人民的安全,发生故障将造成很大的经济损失。因此,对变压器进行故障诊断显得十分重要。其主要故障包括高温过热、中低温过热、局部放电和火花放电等;目前针对上述故障已经提出了多种监测方法,譬如,油中溶解气体分析技术、铁芯接地电流检测技术以及红外热像检测技术;其中油中溶解气体分析技术含有丰富的运行状态信息,可作为变压器故障诊断的依据,但运行状态信息中各种故障数据量参差不齐,正常数据为多数样本,各种故障组成各自的少数样本,由此生成的不平衡数据集将会影响故障诊断算法的准确率。
技术实现思路
本专利技术的目的是提供一种面向不平衡数据集的极限学习机变压器故障诊断方法,该方法能够解决在变压器故障诊断中少数故障集包含的信息量有限,难以确定少数故障集的数据分布,在其内部难以发现规律,从而造成的少数故障集识别率低的问题。本专利技术所采用的技术方案是,一种面向不平衡数据集的极限学习机变压器故障诊断方法,具体按照以下步骤实施:步骤1:数据处理阶段:步骤1.1:将采集的油浸式变压器带有类标签的不平衡样本集S={(x1,t1),(x2,t2)…(xn,tn)}按6:1的比例分为训练样本和测试样本;其中,xi代表样本属性,i=1,2,3,4,5,6,具体包含氢气、甲烷、乙烷、乙烯、乙炔、一氧化碳,六种属性;ti代表类别标签,i=1,2,3,4,5,6,1、2、3、4、5、6分别对应正常状态、中温过热、高温过热、局部放电、火花放电、电弧放电,并用PAM算法对其进行聚类;步骤1.2:运行PAM聚类算法;步骤1.3:计算并记录聚类后的簇心ci=(c1,c2,…c6)的位置;步骤2:SMOTE插值阶段:以PAM算法的聚类簇心作为中心点,取其近邻的5个数据点关联插值从而降低插值对分类结果的影响;步骤3:极限学习机分类输出阶段:将步骤2产生的新数据集仍按6:1分成训练集和测试集,6份用来训练建模,1份用来验证分类效果。本专利技术的特点还在于,步骤1.2具体按照以下步骤实施:Step1:对n个数据中随意选择6个数据作为初始的中心点;Step2:重复;Step3:指派n-6个剩余的数据给离它最近的中心点所代表的簇;Step4:为每一个数据对Oi、Oh计算总代价TCih,其中Oi是当前中心点,Oj是非中心点;Step5:找出所有数据对Oi、Oh的总代价TCih中的最小值minTCih,如果minTCih是负值,用Oh替换Oi,形成新的6个中心点集合;Step6:until(min(TCih≥0));Step7:指派n-6个剩余的数据给离它最近的中心点所代表的簇,终止;在Step3和Step7中使用欧几里德距离作为空间点之间距离的度量公式,上式中,dab代表两个n维向量a(g11,g12,…,g1m)与之间的距离;TCih=∑jCjih(2)上式中,∑j表示对当前全部n-6个非中心点数据Oj的代价Cjih求和。步骤2具体按照以下步骤实施:步骤2.1:采样倍率n取决于数据集的不平衡程度,计算数据集的多数类与少数类之间的不平衡程度IL,采样倍率n的计算公式为:n=round(IL)(3)上式中,round(IL)表示对IL四舍五入后的值;步骤2.2:根据欧几里德距离公式(1)为每一个少数类中的簇心si找到其n个近邻;步骤2.3:进行PAM-SMOTE插值操作;SMOTE算法的插值公式如下:Pi=X+rand(0,1)*(yi-S)i=1,2,…,n(4)上式中,Pi为新插值的样本,S为选择的原始样本数据,rand(0,1)表示0与1之间的某一随机数,yi为原始样本数据S的最近邻样本。步骤3具体按照以下步骤实施:步骤3.1:首先将某一类别样本表示为正类,其他样本表示为负类,训练得出一个决策函数;然后,从负类样本中选取一类表示为正类,其余的依然表示为负类,接着训练得出另一个决策函数,以此类推可以得到6个决策函数,同时也得到了多级极限学习机故障诊断模型;步骤3.2:对极限学习机网络的输入权值矩阵W={wi}和隐藏层结点偏置向量B={bi}进行赋值,其中wi=(wi1,wi2,…win)T是连接第i个隐藏层结点的输入权值;bi是第i个隐藏层结点偏置;βi=[βi1,βi2,…,βim]T是连接第i个隐藏层结点的输出权值,其中所有的步骤3.3:按照公式计算插值后的训练集Snew的网络隐藏层输出矩阵H(W,B,Snew);步骤3.4:按照公式(6)和(7)计算网络的隐藏层输出权值矩阵由于存在一个矩阵G,Gy是线性系统Ax=y的最小范数二乘解,则G为矩阵A的Moore-Penorse广义逆,则有是H的Moore-Penorse广义逆,在的条件下可由正交投影法求得:步骤3.5:用训练出的代入Hβ=T计算输出,其中矩阵H是隐藏层输出矩阵,上式中,wi·xj是wi和xj的内积,激励函数g(·)选择“sigmoid”。本专利技术的有益效果是:(1)本专利技术提出的一种面向不平衡数据集的极限学习机变压器故障诊断方法,能够解决在变压器故障诊断中少数故障集包含的信息量有限,从而难以确定少数故障集的数据分布,在其内部难以发现规律,从而造成的少数故障集识别率低的问题;(2)本专利技术提出的一种面向不平衡数据集的极限学习机变压器故障诊断方法,利用PAM聚类算法对原始数据进行聚类,簇心作为中心,用来SMOTE插值,保证插值结果仍在所属故障类型之中,降低直接使用SMOTE插值对数据的影响,并且解决SMOTE算法可能导致的模糊正负类边界的问题;(3)本专利技术提出的一种面向不平衡数据集的极限学习机变压器故障诊断方法,利用油中气体(氢气、甲烷、乙烷、乙烯、乙炔、一氧化碳)与算法PAM-SMOTE-ELM进行结合,构建变压器故障诊断模型,能够有效检测出油浸式变压器内部故障。附图说明图1为本专利技术方法中DGA-ELM分类结构图;图2为本专利技术方法中PAM-SMOTE-ELM算法流程图。具体实施方式下面结合附图和具体实施方式对本专利技术进行详细说明。本专利技术提供一种面向不平衡数据集的极限学习机变压器故障诊断方法,其流程如图1所示,具体按照以下步骤实施:步骤1:数据处理阶段,步骤1.1:将采集的油浸式变压器带有类标签的不平衡样本集S={(x1,t1),(x2,t2)...(xn,tn)}按6:1的比例分为训练样本和测试样本;其中,xi代表样本属性,i=1,2,3,4,5,6,具体包含氢气、甲烷、乙烷、乙烯、乙炔、一氧化碳,六种属性;ti代表类别标签,i=1,2,3,4,5,6,1、2、3、4、5、6分别对应正常状态、中温过热、高温过热、局部放电、火花放电、电弧放电,并用PAM算法对其进行聚类;步骤1.2:运行PAM聚类算法,具体按照以下步骤实施:Step1:对n个数据中随意选择6个数据作为初始的中心点,设定6是因为本文故障分为6类本文档来自技高网...

【技术保护点】
1.一种面向不平衡数据集的极限学习机变压器故障诊断方法,其特征在于,具体按照以下步骤实施:步骤1:数据处理阶段:步骤1.1:将采集的油浸式变压器带有类标签的不平衡样本集S={(x1,t1),(x2,t2)...(xn,tn)}按6:1的比例分为训练样本和测试样本;其中,xi代表样本属性,i=1,2,3,4,5,6,具体包含氢气、甲烷、乙烷、乙烯、乙炔、一氧化碳,六种属性;ti代表类别标签,i=1,2,3,4,5,6,1、2、3、4、5、6分别对应正常状态、中温过热、高温过热、局部放电、火花放电、电弧放电,并用PAM算法对其进行聚类;步骤1.2:运行PAM聚类算法;步骤1.3:计算并记录聚类后的簇心ci=(c1,c2,…c6)的位置;步骤2:SMOTE插值阶段:以PAM算法的聚类簇心作为中心点,取其近邻的5个数据点关联插值从而降低插值对分类结果的影响;步骤3:极限学习机分类输出阶段:将步骤2产生的新数据集仍按6:1分成训练集和测试集,6份用来训练建模,1份用来验证分类效果。

【技术特征摘要】
1.一种面向不平衡数据集的极限学习机变压器故障诊断方法,其特征在于,具体按照以下步骤实施:步骤1:数据处理阶段:步骤1.1:将采集的油浸式变压器带有类标签的不平衡样本集S={(x1,t1),(x2,t2)...(xn,tn)}按6:1的比例分为训练样本和测试样本;其中,xi代表样本属性,i=1,2,3,4,5,6,具体包含氢气、甲烷、乙烷、乙烯、乙炔、一氧化碳,六种属性;ti代表类别标签,i=1,2,3,4,5,6,1、2、3、4、5、6分别对应正常状态、中温过热、高温过热、局部放电、火花放电、电弧放电,并用PAM算法对其进行聚类;步骤1.2:运行PAM聚类算法;步骤1.3:计算并记录聚类后的簇心ci=(c1,c2,…c6)的位置;步骤2:SMOTE插值阶段:以PAM算法的聚类簇心作为中心点,取其近邻的5个数据点关联插值从而降低插值对分类结果的影响;步骤3:极限学习机分类输出阶段:将步骤2产生的新数据集仍按6:1分成训练集和测试集,6份用来训练建模,1份用来验证分类效果。2.根据权利要求1所述的一种面向不平衡数据集的极限学习机变压器故障诊断方法,其特征在于,所述步骤1.2具体按照以下步骤实施:Step1:对n个数据中随意选择6个数据作为初始的中心点;Step2:重复;Step3:指派n-6个剩余的数据给离它最近的中心点所代表的簇;Step4:为每一个数据对Oi、Oh计算总代价TCih,其中Oi是当前中心点,Oj是非中心点;Step5:找出所有数据对Oi、Oh的总代价TCih中的最小值minTCih,如果minTCih是负值,用Oh替换Oi,形成新的6个中心点集合;Step6:until(min(TCih≥0));Step7:指派n-6个剩余的数据给离它最近的中心点所代表的簇,终止。3.根据权利要求2所述的一种面向不平衡数据集的极限学习机变压器故障诊断方法,其特征在于,在Step3和Step7中使用欧几里德距离作为空间点之间距离的度量公式,上式中,dab代表两个n维向量a(g11,g12,…,g1m)与之间的距离;TCih=∑jCjih(2)上式中,∑j表示对当前全部n-6个非中心点数据Oj的...

【专利技术属性】
技术研发人员:黄新波马玉涛朱永灿曹雯蒋波涛
申请(专利权)人:西安工程大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1