一种基于代价敏感和集成学习的变压器故障诊断方法技术

技术编号:26172909 阅读:70 留言:0更新日期:2020-10-31 13:53
本发明专利技术公开了一种基于代价敏感和集成学习的变压器故障诊断方法,该方法包括:对多种变压器故障数据进行预处理,分为训练样本集和测试集;基于AdaCost算法建立变压器故障诊断模型;使用分布权重为D

A transformer fault diagnosis method based on cost sensitivity and ensemble learning

【技术实现步骤摘要】
一种基于代价敏感和集成学习的变压器故障诊断方法
本专利技术涉及电力设备故障检测
,特别是涉及一种基于代价敏感和集成学习的变压器故障诊断方法。
技术介绍
利用机器学习等人工智能技术对电力设备大数据深度挖掘和分析是智能运维领域的大势所趋。电力变压器作为电力系统中重要电气设备之一,掌握其运行状态对提高电力变压器运行维护水平,确保电网安全运行均具有重要意义。由于电力变压器非正常状态样本极少,同时故障案例与异常样本信息存在缺失、不完善等问题,导致变压器样本数据集的类别数量分布不均衡。人工神经网络(artificialneuralnetwork,ANN)、支持向量机(supportvectormachine,SVM)等分类模型虽在变压器故障诊断方面已取得不错效果,但针对变压器不平衡样本集,由于其通常以损失值最小或类别间隔最大为训练目标,类别间隔面将向类别中样本分布比较稀疏的方向移动,因此,故障样本的漏判率远高于正常样本,其无法保证故障样本的分类精度,这将给电力系统,乃至社会经济和生活带来重大的损失。非均衡数据集的类别数量分布极端不均衡,在机器学习模型进行分类任务的分析预测,会出现过拟合、欠拟合等问题,极大降低了机器学习模型的准确性和鲁棒性。对于非均衡数据集的研究是机器学习领域的焦点与难题。目前,业界学者针对提高少数类样本的分类性能进行了大量研究,提出的方法主要归纳为算法和数据2个层面。数据层面主要包括欠采样和过采样。其本质是通过增加少数类样本或减少多数类样本达到样本均衡化。非均衡数据集的处理方法主要分为随机过采样、随机欠采样、均衡采样、合成少数类过采样4种。但是,算法层面主要以代价敏感法为主,目前已被广泛应用于图像识别、医学诊断、信用评分等众多领域。代价敏感学习方法主要有以下3种实现方式:(1)从学习模型出发,着眼于对某一具体学习方法的改造,使之能适应不平衡数据下的学习,如感知机,支持向量机,决策树,神经网络等分别都有其代价敏感的版本。以代价敏感的决策树为例,可从3个方面对其进行改进以适应不平衡数据的学习,这3个方面分别是决策阈值选择、分裂标准选择以及剪枝方面,通过在其中引入代价矩阵引入实现模型本身对不平衡数据集的适应性。(2)从贝叶斯风险理论出发,把代价敏感学习看成是分类结果的一种后处理,按照传统方法学习到一个模型,以实现损失最小为目标对结果进行调整。(3)从预处理的角度出发,将代价用于权重的调整,使得分类器满足代价敏感的特性,即在分类器训练过程中通过提高代价高的误分类样本对应的权重进而使得分类器更关注该类样本。其代表的算法是基于集成学习的AdaCost算法。在诸多运用代价敏感算法的讨论中,代价矩阵中的各元素,即各类别之间的误诊代价往往是由领域专家综合领域知识给出的,具有一定的主观性。但在实际变压器故障诊断中,各故障之间误诊代价很难准确给出,需要领域专家综合领域知识以及反复的试验,综合考虑故障严重程度、故障性质等因素;同时,由专家打分确定的代价矩阵难免会具有较强的主观性。
技术实现思路
本专利技术的目的是提供一种基于代价敏感和集成学习的变压器故障诊断方法,基于AdaCost算法,提高代价高的误差分类样本的权重,降低代价高的正确分类样本的权重,解决不平衡数据集下分类器整体精度低的问题,进而提高故障判断准确性。为实现上述目的,本专利技术提供了如下方案:一种基于代价敏感和集成学习的变压器故障诊断方法,包括以下步骤:S1,对多种变压器故障数据进行预处理,分为训练样本集和测试集;S2,基于AdaCost算法建立变压器故障诊断模型,令训练样本集为X={(x1,y1),(x2,y2),…,(xm,ym)},其中xi为油中溶解气体构成的样本特征向量,yi为故障类型标签,xi∈X,yi∈Y={+1,-1};令迭代次数为t,t=1,2,…,T;令第t次迭代的样本权重分布为Dt=(wt1,wt2,…,wti),i=1,2,…,m,且令第t次迭代形成的弱学习器为ht(x);S3,使用分布权重为Dt的训练样本集训练得到弱学习器ht(x);S4,计算ht(x)的学习误差率et,t=1,2,…,T,其中I(x)为误差函数;S5,计算ht(x)在形成强分类器过程中所占的权重αt,t=1,2,…,T;S6,引入代价因子,更新训练样本集中各样本的权重分布;S7,t依次取1,2,…,T,反复迭代,直至学习误差率满足误差率要求的迭代次数T,通过结合策略对所有弱学习器进行整合形成强学习器;S8,将测试集输入所述强学习器中,进行投票确定故障类型。可选的,所述步骤S4,计算ht(x)的学习误差率et,t=1,2,…,T,具体包括:计算公式为:可选的,所述步骤S5,计算ht(x)在形成强分类器过程中所占的权重αt,t=1,2,…,T,具体包括:计算公式为:可选的,所述步骤S6,引入代价因子,更新训练样本集中各样本的权重分布,具体包括:其中,βi是惩罚因子,由代价矩阵得到;Zt是归一化因子,保证各样本的权重分布之和为1,计算公式如下:可选的,所述步骤S7,t依次取1,2,…,T,反复迭代,直至学习误差率满足误差率要求的迭代次数T,通过结合策略对所有弱学习器进行整合形成强学习器,具体包括:强分类器H(x)表示如下:根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:本专利技术提供的基于代价敏感和集成学习的变压器故障诊断方法,基于AdaCost算法构建变压器故障诊断模型,AdaCost算法是基于AdaBoost算法改进而来的,修改了Adaboost算法的权重更新策略,在Dt(x)中引入代价因子βi,βi构成的矩阵称为代价矩阵,使得代价高的误分类样本大大地提高其权重,而对于代价高的正确分类样本适当地降低其权重,使其权重降低相对较小,总体思想是代价高样本权重增加得大降低得慢,进而解决不平衡数据集下分类器整体精度低的问题;因此,AdaCost算法考虑了误分类的代价差异,能够很好的处理变压器故障数据集的不平衡性问题,提高了分类算法对故障样本的识别能力和整体的分类准确率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为boosting算法的原理示意图;图2为AdaBoost训练过程流程图;图3为代价矩阵构成图;图4为基于AdaCost的变压器故障诊断模型。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例本文档来自技高网
...

【技术保护点】
1.一种基于代价敏感和集成学习的变压器故障诊断方法,其特征在于,包括以下步骤:/nS1,对多种变压器故障数据进行预处理,分为训练样本集和测试集;/nS2,基于AdaCost算法建立变压器故障诊断模型,令训练样本集为X={(x

【技术特征摘要】
1.一种基于代价敏感和集成学习的变压器故障诊断方法,其特征在于,包括以下步骤:
S1,对多种变压器故障数据进行预处理,分为训练样本集和测试集;
S2,基于AdaCost算法建立变压器故障诊断模型,令训练样本集为X={(x1,y1),(x2,y2),…,(xm,ym)},其中xi为油中溶解气体构成的样本特征向量,yi为故障类型标签,xi∈X,yi∈Y={+1,-1};令迭代次数为t,t=1,2,…,T;令第t次迭代的样本权重分布为Dt=(wt1,wt2,…,wti),i=1,2,…,m,且令第t次迭代形成的弱学习器为ht(x);
S3,使用分布权重为Dt的训练样本集训练得到弱学习器ht(x);
S4,计算ht(x)的学习误差率et,t=1,2,…,T,其中I(x)是误差函数;
S5,计算ht(x)在形成强分类器过程中所占的权重αt,t=1,2,…,T;
S6,引入代价因子,更新训练样本集中各样本的权重分布;
S7,t依次取1,2,…,T,反复迭代,直至学习误差率满足误差率要求的迭代次数T,通过结合策略对所有弱学习器进行整合形成强学习器;
S8,将测试集输入所述强学习器中,进行投票确定故障类型。

【专利技术属性】
技术研发人员:刘云鹏和家慧刘一瑾王权
申请(专利权)人:华北电力大学保定
类型:发明
国别省市:河北;13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1