一种基于XGBoost梯度提升的变压器故障诊断方法技术

技术编号:37533944 阅读:14 留言:0更新日期:2023-05-12 16:01
本发明专利技术提供一种基于XGBoost梯度提升的变压器故障诊断方法,其包括收集设备的故障集数据;基于所收集的故障集数据,分析统计变压器故障类型数量,并根据故障集的量级及故障集数据完整程度选取叶子节点切分算法,以及建立目标函数;根据选取的叶子节点切分算法以及建立的目标函数生成决策树算法模型;将需要预测的数据输入所建立的决策树算法模型,得到设备的故障诊断状态。本发明专利技术可以削弱甚至避免现有技术中变压器发生故障时带来的安全隐患或影响,其采用XGBoost分布式梯度提升算法分析故障油中气体特征信号,建立油色谱故障诊断决策树,实现对变压器运行故障的判别,具有高精度、模型更简单及过拟合程度低的特点。型更简单及过拟合程度低的特点。型更简单及过拟合程度低的特点。

【技术实现步骤摘要】
一种基于XGBoost梯度提升的变压器故障诊断方法


[0001]本专利技术涉及智能电网在线监测
,具体涉及一种基于XGBoost梯度提升的变压器故障诊断方法。

技术介绍

[0002]变压器作为确保用户用电的基础设备,其不仅仅用于对电压进行高低压转换以进行长距离运输和日常使用,也起到了安全隔离的重要作用。当变压器发生故障时,产生的经济损失往往是不可估量的,与此同时更会带来生产生活上的安全问题,因此,对变压器的状态进行实时监控与状态判断便是不可或缺的重要技术。
[0003]油浸式变压器内部有许多纤维素绝缘材料,例如纸、层压纸板和木块等等。这些绝缘材料在高温下会完成裂解和碳化,释放出低分子烃类气体及糠醛等化合物,这些化合物溶解于油中,因此对变压器进行油色谱分析,解析出这些化合物的含量,便有助于确认当前变压器设备的故障状态或潜伏的隐患。
[0004]XGBoost梯度提升算法是一种高效、灵活且可移植的算法。因其支持在Hadoop、Kubernetes、Dask等多个分布式环境上运行,所以能够很好的解决工业界大规模数据的问题,同样非常适应于解决变压器故障诊断。
[0005]随着现代化工生产的不断规模化和复杂化,当生产中发生的故障不能准确辨识并及时恢复时,往往会造成巨大损失。随着工业过程中大量反映过程机理的数据不断生成,通过高效、灵活且可移植的算法模型对工业过程进行故障诊断变得越来越受欢迎。

技术实现思路

[0006]本专利技术的目的在于提供一种基于XGBoost梯度提升的变压器故障诊断方法,该方法可以削弱甚至避免现有技术中变压器发生故障时带来的安全隐患或影响,其采用XGBoost分布式梯度提升算法分析故障油中气体特征信号,建立油色谱故障诊断决策树,实现对变压器运行故障的判别,具有高精度、模型更简单及过拟合程度低的特点。
[0007]为解决上述问题,本专利技术所采用的技术方案如下:
[0008]一种基于XGBoost梯度提升的变压器故障诊断方法,该方法包括以下步骤:
[0009]收集设备的故障集数据;
[0010]基于所收集的故障集数据,分析统计变压器故障类型数量,并根据故障集的量级及故障集数据完整程度选取叶子节点切分算法,以及建立目标函数;
[0011]根据选取的叶子节点切分算法以及建立的目标函数生成决策树算法模型;
[0012]将需要预测的数据输入所建立的决策树算法模型,得到设备的故障诊断状态。
[0013]根据本专利技术提供的一种基于XGBoost梯度提升的变压器故障诊断方法,所述选取叶子节点切分算法,包括:
[0014]在默认情况下,选择贪心算法作为分裂节点的首选算法;
[0015]当数据量过于庞大无法读入内存时,选取近似算法;
[0016]当输入值存在数据缺失情况时,选取稀疏感知算法。
[0017]根据本专利技术提供的一种基于XGBoost梯度提升的变压器故障诊断方法,所述建立目标函数,包括:由预测值与真实值组成损失函数并添加合适的正则项形成目标函数。
[0018]根据本专利技术提供的一种基于XGBoost梯度提升的变压器故障诊断方法,所述选择贪心算法作为分裂节点的首选算法,包括:
[0019]针对每个叶节点,枚举出所有可用的特征;
[0020]对于每一个特征,以升序排列对属于这个节点的训练样本针对该特征值进行排列,以线性扫描的方式决定这个特征的最优分裂点,并记录该特征的分裂收益;
[0021]选择中收益最大的特征为分裂特征,并令其最佳分裂点为分裂位置分裂出两个新的叶节点,为这些新节点关联对应的样本集;
[0022]返回枚举步骤,递归执行至生成最优树。
[0023]根据本专利技术提供的一种基于XGBoost梯度提升的变压器故障诊断方法,所述选取近似算法,包括:
[0024]根据特征的分布确定l个候选切分点s
k
={s
k1
,s
k2
,

,s
kl
};
[0025]根据确定的l个候选切分点将相应的样本放入对应的容器中并对每个容器的G,H进行累加,并在这些累计的统计量上寻求最佳分裂点,从而获取每个特征的候选分割点的G,H值,表示为公式(11)和(12):
[0026]G
kv

=∑
j
∈{j|s
k
,v≥x
jk
>s
k
,v

1]g
j
ꢀꢀꢀ
(11)
[0027]H
kv

=∑
j
∈{j|s
k
,v≥x
jk
>s
k
,v

1}h
j
ꢀꢀꢀ
(12)
[0028]在获取到的候选切分点集合上贪心查找获取最佳节点划分增益。
[0029]根据本专利技术提供的一种基于XGBoost梯度提升的变压器故障诊断方法,所述选取稀疏感知算法,包括:
[0030]在构建树的节点过程中只考虑非缺失值的数据遍历,并且为每个节点增加了一个缺省方向,当样本相应的特征值缺失时,分别枚举特征缺省的样本划分为左右分支之后的增益,比较后选取到增益最大的枚举项并将其选择为最优缺省方向,将缺失的特征值归类到该缺省方向上。
[0031]根据本专利技术提供的一种基于XGBoost梯度提升的变压器故障诊断方法,所述由预测值与真实值组成损失函数,包括:
[0032]用预测值与真实值y
i
计算损失函数,表示为公式(21):
[0033][0034]其中,n为样本数量;
[0035]在目标函数中添加正则项Ω,即由所获得的损失函数L与抑制模型复杂度的正则项Ω计算得到目标函数,表示为公式(22):
[0036][0037]其中,是将所有t棵树的复杂度相加得到;
[0038]对获取到的目标函数进行泰勒公式二阶展开得到目标函数的近似值,表示为公式(23):
[0039][0040]其中,constant为前t

1棵树的复杂度之和;
[0041]去除所求的近似值中所有的常数项,并对f
t
(x
i
)求偏导并使其导函数等于0,得f
t
(x
i
)
*
,进而得到目标函数,表示为公式(24):
[0042][0043]根据本专利技术提供的一种基于XGBoost梯度提升的变压器故障诊断方法,所述生成决策树算法模型,包括:
[0044]计算出每一步损失函数的一阶导和二阶导的结果,从而对目标函数实现最优化,即可得到每一步的f(x),并且由加法模型得到整体的决策树算法模型。
[0045]根据本专利技术提供的一种基于XGBoos本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于XGBoost梯度提升的变压器故障诊断方法,其特征在于,该方法包括以下步骤:收集设备的故障集数据;基于所收集的故障集数据,分析统计变压器故障类型数量,并根据故障集的量级及故障集数据完整程度选取叶子节点切分算法,以及建立目标函数;根据选取的叶子节点切分算法以及建立的目标函数生成决策树算法模型;将需要预测的数据输入所建立的决策树算法模型,得到设备的故障诊断状态。2.根据权利要求1所述的方法,其特征在于,所述选取叶子节点切分算法,包括:在默认情况下,选择贪心算法作为分裂节点的首选算法;当数据量过于庞大无法读入内存时,选取近似算法;当输入值存在数据缺失情况时,选取稀疏感知算法。3.根据权利要求1所述的方法,其特征在于,所述建立目标函数,包括:由预测值与真实值组成损失函数并添加合适的正则项形成目标函数。4.根据权利要求2所述的方法,其特征在于,所述选择贪心算法作为分裂节点的首选算法,包括:针对每个叶节点,枚举出所有可用的特征;对于每一个特征,以升序排列对属于这个节点的训练样本针对该特征值进行排列,以线性扫描的方式决定这个特征的最优分裂点,并记录该特征的分裂收益;选择中收益最大的特征为分裂特征,并令其最佳分裂点为分裂位置分裂出两个新的叶节点,为这些新节点关联对应的样本集;返回枚举步骤,递归执行至生成最优树。5.根据权利要求2所述的方法,其特征在于,所述选取近似算法,包括:根据特征的分布确定l个候选切分点s
k
={s
k1
,s
k2
,...,s
k1
};根据确定的l个候选切分点将相应的样本放入对应的容器中并对每个容器的G,H进行累加,并在这些累计的统计量上寻求最佳分裂点,从而获取每个特征的候选分割点的G,H值,表示为公式(11)和(12):G
kv

=∑
j
∈{j|s
k
,v≥x
jk
>s
k
,v

1}g
j
ꢀꢀꢀꢀ
(11)H
kv

=∑
j
∈...

【专利技术属性】
技术研发人员:何伟铖曹诗兵何文辉朱志伟李霞刘要锋
申请(专利权)人:珠海万力达电气自动化有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1