一种考虑不平衡数据样本的变压器故障诊断方法及系统技术方案

技术编号:21888630 阅读:13 留言:0更新日期:2019-08-17 13:19
本发明专利技术公开了一种考虑不平衡数据样本的变压器故障诊断方法,包括步骤:100:采集变压器的油色谱样本数据,并对其进行预处理得到经过预处理的油色谱样本数据;200:构建并训练第一级分类器,其中采用经过预处理的油色谱样本数据对第一级分类器进行训练;基于第一级分类器输出的状态特征与油色谱样本数据得到特征融合向量;300:基于EasyEnsemble集成学习方法对第二级分类器进行训练,基于若干个第二级子分类器的输出合成第二级分类器;400:将需要诊断的变压器油色谱数据输入第一级分类器,则从第二级分类器的输出端输出该变压器油色谱数据表征的变压器状态。该变压器故障诊断方法相对于传统方法取得更准确且平衡的效果。

A Transformer Fault Diagnosis Method and System Considering Unbalanced Data Samples

【技术实现步骤摘要】
一种考虑不平衡数据样本的变压器故障诊断方法及系统
本专利技术涉及电力系统中的故障诊断方法及系统,尤其涉及一种变压器故障诊断方法及系统。
技术介绍
电力变压器在电力系统中承担着重要作用,其是否正常运行与电网能否可靠供电密切相关。虽然近年我国电气设备研发制造技术已经跻身国际前列,但绝缘自然老化、环境条件恶劣、运行负荷过高等多种不良因素仍多次诱发电力变压器故障,造成社会经济损失,严重的还将导致大范围断电、电网瓦解等严重事故。变压器油中溶解气体分析(dissolvedgasanal-ysis,简称DGA)方法,通过绝缘油中氢气、甲烷、乙烯、乙炔和乙烯等特征气体在不同运行状态下组分含量和产气速率的差异分析,为变压器运行状态评估提供了重要依据,并具有支持带电在线检测的优点,在我国变压器状态监测和故障诊断领域得到了广泛应用。根据实际经验和理论分析,研究学者在初期建立了三比值法、Rogers比值法和大卫三角形法等流程简单的基础方法体系,但受到编码缺失、阈值绝对、现场勘察等限制,现已逐渐成为变压器故障诊断的辅助手段。随着机器学习理论发展,基于人工智能故障诊断方法以其对变压器运行状态类型分类较高的准确率,成为了学界热门的研究方向。然而由于变压器实际运行中故障发生的频率较低,且采集到的故障类型间样本数量差距较大,最终采集到的油色谱数据故障案例库为规模较小的不平衡数据集。在数据不平衡的情况下,支持向量机、决策树、贝叶斯网络、深度信念网络等大部分较为基础的模型容易在最大化全体准确率的目标过程中,偏向多数类样本的参数更新而忽略少数类样本的正确分类。目前,欠采样、过采样方法,和集成学习方法,分别在数据采样层面和算法优化层面,被广泛用于缓解不平衡数据集的训练问题。在油气数据故障案例库本身总样本数不够丰富的情况下,欠采样算法减少多数类样本的方式将丧失部分的潜在有用信息,因此不可以单独在变压器故障诊断问题中使用。基于此,期望获得一种新的变压器故障诊断方法,其可以减小故障案例库数据不平衡的不良影响,全面提升各故障类型的泛化能力。该变压器故障诊断方法可以在提升全体样本准确率的情况下,可以同时也保证少数类样本的识别率与多数类样本的识别率水平相近,相对于传统方法可以取得更准确且平衡的效果。
技术实现思路
本专利技术的目的之一是提供一种考虑不平衡数据样本的变压器故障诊断方法,该变压器故障诊断方法可以减小故障案例库数据不平衡的不良影响,全面提升各故障类型的泛化能力。该变压器故障诊断方法从层次分类和集成学习两个方面对变压器的故障诊断模型进行构建,通过利用多级类别间互相约束的关系和在训练时平衡类别间信息,在提升全体样本准确率的情况下,同时保证少数类样本的识别率与多数类样本的识别率水平相近,因而相对于传统方法取得了更准确且平衡的效果。根据上述专利技术目的,本专利技术提出一种考虑不平衡数据样本的变压器故障诊断方法,包括步骤:100:采集变压器的油色谱样本数据,并对其进行预处理得到经过预处理的油色谱样本数据;200:构建并训练第一级分类器,其中采用经过预处理的油色谱样本数据对神经网络构建的第一级分类器进行训练;基于第一级分类器输出的状态特征与油色谱样本数据得到特征融合向量;300:基于EasyEnsemble集成学习方法对采用神经网络构建的第二级分类器进行训练,其中:根据表征变压器各状态的油色谱样本数据的数量分布,将特征融合向量分成少数类样本和多数类样本;其中对多数类样本进行欠采样以减少多数类样本的数量;将少数类样本和经过欠采样的多数类样本均衡地分配到若干个子集中;将若干个子集分别对应输入若干个第二级子分类器中进行训练;基于若干个第二级子分类器的输出合成第二级分类器;400:将需要诊断的变压器油色谱数据输入第一级分类器,则从第二级分类器的输出端输出该变压器油色谱数据表征的变压器状态。在本专利技术所述的变压器故障诊断方法中,为了减小采集时各个油色谱样本数据会有数值波动影响,因此,在步骤100中,对油色谱样本数据进行预处理,随后通过第一级分类器对经过预处理的油色谱样本数据进行进行训练,进而基于第一级分类器输出的状态特征与油色谱样本数据得到特征融合向量。考虑到油色谱样本数据为DAG结构,其存在叶子节点拥有多个父节点的情况,因此,采用第一级分类器以及基于EasyEnsemble集成学习方法对采用神经网络构建的第二级分类器,从而使得在第二级分类器中可以建立若干个第二级子分类器以承担该第二级子分类器所有节点标签的决策战略,同时还可以将第一级分类器所得到特征融合向量作为第二级子分类器的输入,以提供第二级子分类器中各节点关系的引导信息,最终基于若干个第二级子分类器的输出合成第二级分类器。将需要诊断的变压器油色谱数据输入第一级分类器,则从第二级分类器的输出端输出该变压器油色谱数据表征的变压器状态。由于本专利技术所述的技术方案中采用基于EasyEnsemble集成学习方法,利用其对多数类样本进行欠采样构造平衡的多个子集,和集成差异化的第二级子分类器作为强分类器,以充分挖掘不平衡数据集中的潜在有用信息。并且由于本专利技术所述的技术方案中通过欠采样生成多个数据平衡的子集进行并行训练,在每个第二级子分类器中都完成了对少数类样本的引导,再将第二级子分类器的输出合成最终第二级分类器,从而避免了发生欠采样丢失数据信息的问题。为了更进一步说明本专利技术所述的技术方案如何基于EasyEnsemble集成学习方法对采用神经网络构建的第二级分类器进行训练,以给定K类的多类别分类问题,记不平衡数据集类别C1,C2,...,CK中样本数目最少的一类为少数类样本集P,数目为|P|,其余多数类样本集为N1,N2,...,NK-1。那么,对所有多数类样本集进行重复T次有放回的随机独立欠采样,则每个多数类样本集Ni可产生若干子集Nit,且满足:|Nit|=|P|。再将每次欠采样得到的多数类样本子集Nt,且多数类样本子集Nt与少数类样本集P组合为每个第二级子分类器ht的子集Dt,且Dt=Nt∪P。此时,子集Dt每个类别数目相同,为平衡数据集。分别以子集Dt作为输入对每个第二级子分类器ht使用AdaBoost算法进行次数为si的迭代训练,输出如下公式所示:其中,y为输入x的真实标签,htd(x)为训练迭代次数为d时的输出,εt为弱分类器ht的误差函数,k∈{1,2,...K}为C1,C2,...,CK的下标。需要注意的是,基于EasyEnsemble集成学习方法的第二级分类器是对所有第二级子分类器ht的参数进行集成,而不是对第二级子分类器的输出ht(x)进行结果投票获得最终决策,也就是说,第二级分类器的输出H(x)可表达为如下式所示:由此可以看出,本专利技术所述的考虑不平衡数据样本的变压器故障诊断方法可以减小故障案例库数据不平衡的不良影响,全面提升各故障类型的泛化能力。该变压器故障诊断方法从层次分类和集成学习两个方面对变压器的故障诊断模型进行构建,通过利用多级类别间互相约束的关系和在训练时平衡类别间信息,在提升全体样本准确率的情况下,同时保证少数类样本的识别率与多数类样本的识别率水平相近,因而相对于传统方法取得了更准确且平衡的效果。进一步地,在本专利技术所述的变压器故障诊断方法中,第一级分类器的输出表征变压器的粗分状态,第二级分类器的输出表征本文档来自技高网
...

【技术保护点】
1.一种考虑不平衡数据样本的变压器故障诊断方法,其特征在于,包括步骤:100:采集变压器的油色谱样本数据,并对其进行预处理得到经过预处理的油色谱样本数据;200:构建并训练第一级分类器,其中采用经过预处理的油色谱样本数据对神经网络构建的第一级分类器进行训练;基于第一级分类器输出的状态特征与油色谱样本数据得到特征融合向量;300:基于EasyEnsemble集成学习方法对采用神经网络构建的第二级分类器进行训练,其中:根据表征变压器各状态的油色谱样本数据的数量分布,将特征融合向量分成少数类样本和多数类样本;其中对多数类样本进行欠采样以减少多数类样本的数量;将少数类样本和经过欠采样的多数类样本均衡地分配到若干个子集中;将若干个子集分别对应输入若干个第二级子分类器中进行训练;基于若干个第二级子分类器的输出合成第二级分类器;400:将需要诊断的变压器油色谱数据输入第一级分类器,则从第二级分类器的输出端输出该变压器油色谱数据表征的变压器状态。

【技术特征摘要】
1.一种考虑不平衡数据样本的变压器故障诊断方法,其特征在于,包括步骤:100:采集变压器的油色谱样本数据,并对其进行预处理得到经过预处理的油色谱样本数据;200:构建并训练第一级分类器,其中采用经过预处理的油色谱样本数据对神经网络构建的第一级分类器进行训练;基于第一级分类器输出的状态特征与油色谱样本数据得到特征融合向量;300:基于EasyEnsemble集成学习方法对采用神经网络构建的第二级分类器进行训练,其中:根据表征变压器各状态的油色谱样本数据的数量分布,将特征融合向量分成少数类样本和多数类样本;其中对多数类样本进行欠采样以减少多数类样本的数量;将少数类样本和经过欠采样的多数类样本均衡地分配到若干个子集中;将若干个子集分别对应输入若干个第二级子分类器中进行训练;基于若干个第二级子分类器的输出合成第二级分类器;400:将需要诊断的变压器油色谱数据输入第一级分类器,则从第二级分类器的输出端输出该变压器油色谱数据表征的变压器状态。2.如权利要求1所述的变压器故障诊断方法,其特征在于,所述第一级分类器的输出表征变压器的粗分状态,所述第二级分类器的输出表征变压器的细分状态。3.如权利要求2所述的变压器故障诊断方法,其特征在于,所述粗分状态至少包括:正常、放电故障、过热故障;所述细分状态至少包括:正常、局部放电、低能放电、高能放电、低能放电兼过热、高能放电兼过热、低温过热、中温过热、高温过热。4.如权利要求1所述的变压器故障诊断方法,其特征在于,采用卷积神经网络构建第一级分类器和/或第二级分类器。5.如权利要求1所述的变压器故障诊断方法,其特征在于,对油色谱样本数据进行预处理至少包括归一化处理。6.一种考虑不平衡数据样本...

【专利技术属性】
技术研发人员:苏磊徐鹏黄华陈璐傅晨钊司文荣崔宇侯慧娟盛戈皞江秀臣
申请(专利权)人:国网上海市电力公司上海交通大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1