一种基于缺失数据修复的主变在线故障诊断方法技术

技术编号:36589751 阅读:16 留言:0更新日期:2023-02-04 17:54
本发明专利技术公开了一种基于缺失数据修复的主变在线故障诊断方法。为了克服变压器油色谱在线监测数据缺失问题;本发明专利技术包括以下步骤:S1:对采集的油色谱数据样本依次以不同的指标维度分割,构建树状模型;S2:根据故障类型与指标维度的关联关系,确定不同故障类型对应树状模型中树枝末端的数据集合;S3:判断数据集合中缺失数据是否影响故障诊断,若是,则进入步骤S4,否则,直接进入步骤S5;S4:根据曼哈顿距离查找获得的最相邻树枝节点数据,修复缺失数据;S5:匹配历史数据进行故障类型的诊断。通过查找最相邻的节点数据来修复缺失数据,相比现有的通过历史数据对比获得,更加精准。更加精准。更加精准。

【技术实现步骤摘要】
一种基于缺失数据修复的主变在线故障诊断方法


[0001]本专利技术涉及一种主变故障诊断领域,尤其涉及一种基于缺失数据修复的主变在线故障诊断方法。

技术介绍

[0002]故障诊断的任务是根据状态监测所获得的信息,结合已知的系统结构和参数以及环境条件或系统设备的运行历史数据(包括运行历史记录和曾经发生过的故障记录及维修记录等),对可能要发生的或已经发生的故障进行预报和分析、判断,确定故障的性质、类别、程度、原因、部位,指出故障发生和发展的趋势及其后果,提出控制故障继续发展和消除故障的调整、维修、治理的对策措施并加以实施,最终使设备复原到正常状态。生产装置或设备上不同部位、不同类型的故障,引起功能的不同变化,导致装置整体及各部位状态和运行参数的不同变化,故障诊断的目的就是当某一部位出现某种故障时,要从这些状态及参数的变化推断出导致这些变化的故障类型及所在部位。由于过程参数的数据量非常大,必须找出其中的特征信息,提取特征量,才便于对故障进行诊断。
[0003]数据质量是影响变压器故障诊断正确率的重要因素,然而因为各种因素会造成在线监测数据的缺失,目前的故障诊断方法没有考虑到数据丢失的相关问题。例如,一种在中国专利文献上公开的“基于多元线性回归的变压器油色谱的故障诊断方法及系统”,其公告号CN114152685A,,包括以下步骤:获取变压器特征气体信息;根据特征气体信息和预设的变压器油色谱故障诊断模型,得到变压器故障诊断结果;所述变压器油色谱故障诊断模型利用多元线性回归模型对特征气体成分预测,基于特征气体预测量与特征气体预设阈值判断变压器运行状态。该方案实现对变压器运行状态的实时监测,及时发现变压器内部潜在故障,防患于未然,提高电力系统运行的可靠性,但是该方案没有考虑到压器油色谱在线监测数据缺失的问题。

技术实现思路

[0004]本专利技术主要解决现有技术变压器油色谱在线监测数据缺失问题;提供一种基于缺失数据修复的主变在线故障诊断方法,获得的最相邻数据,修复缺失数据。
[0005]本专利技术的上述技术问题主要是通过下述技术方案得以解决的:一种基于缺失数据修复的主变在线故障诊断方法,包括以下步骤:S1:对采集的油色谱数据样本依次以不同的指标维度分割,构建树状模型;S2:根据故障类型与指标维度的关联关系,确定不同故障类型对应树状模型中树枝末端的数据集合;S3:判断数据集合中缺失数据是否影响故障诊断,若是,则进入步骤S4,否则,直接进入步骤S5;S4:根据曼哈顿距离查找获得的最相邻树枝节点数据,修复缺失数据;S5:匹配历史数据进行故障类型的诊断。
[0006]本申请的方案通过不同维度分割数据样本,使得每个数据样本具有更好的平衡性。通过查找最相邻的节点数据来修复缺失数据,相比现有的通过历史数据对比获得,更加精准。
[0007]作为优选,所述的油色谱数据样本中包括若干种可溶油中的气体组分含量;分别以一个气体组分作为一个指标维度。以气体组分的种类作为分割的维度,保证树状模型的平衡性。
[0008]作为优选,所述的树状模型构建过程为:S101:分别计算数据样本中各指标维度的方差;S102:取方差值最大的指标维度为分割维度,将各组数据样本按分割维度中数据的大小顺序排列;方差越大表明数据在该维度上的分散性越好,在这个方向上进行分割可以有效地保证树的平衡性。
[0009]S103:以队列中间的数据样本为分割界限,将一个数据队列分割为两个数据子队列;S104:判断数据子队列中的数据样本数量是否小于数量阈值或分割次数是否达到分割阈值;若是,则完成该支节点的分割;若否,则对于各数据子队列返回步骤S101。
[0010]树状模型的每个节点都是一棵多维点的二叉树,所有的非叶子节点都可以看作一个空间分割的超平面,通过对搜索空间进行无重叠的层次划分,建立适用于高效数据检索的索引结构。当该方法应用于变压器油色谱数据的结构化存储时,每一条油色谱样本数据包含多维指标,并存放在树状模型的一个节点中。
[0011]作为优选,树状模型中各树枝节点的每个指标维度分别标记有分割系数;在分割获得各树枝节点的过程中,将历次分割的分割维度所对应的分割系数加一。根据方差来分割数据,方差越大表明数据在该维度上的分散性越好,在这个方向上进行分割可以有效地保证树的平衡性。本方案用于后续的故障类型与维度指标的关联性计算。
[0012]作为优选,所述的故障类型包括过热故障和放电故障两大类;所述的过热故障包括高温过热、中温过热和低温过热;所述的放电故障包括局部放电、高能放电和低能放电。
[0013]不同故障类型与不同的维度指相关联。
[0014]作为优选,所述的步骤S2具体包括以下过程:S201:构建故障类型与指标维度关联表;关联表中包括各故障类型对应的主要指标维度特征和次要指标维度特征;S202:对各故障类型的主要指标维度特征和次要指标维度特征分别赋予维度权重值;S203:以特定故障类型为诊断目标,分别以对应的维度权重值计算树状模型中各树枝末端的数据样本的关联指数;S204:取关联指数大于关联阈值的数据样本的集合为诊断数据样本集合。
[0015]选取与待诊断的故障类型关联性较大的数据样本集合用于对应故障类型的诊断。
[0016]作为优选,关联指数的计算过程为:
其中,R
yn
第y种故障类型对应的树状模型中第n个树枝末端的数据样本的关联指数;ω
yk
为第y种故障类型对应的第k个指标维度的维度权重值;K为指标维度的总个数;f
nk
为树状模型中第n个树枝末端的数据样本在第k个指标维度的分割系数。
[0017]以分割时的分割维度使用次数来计算关联指数。
[0018]作为优选,所述的步骤S3具体包括以下过程:S301:判断诊断数据样本集合中是否存在数据缺失;若是,则进入步骤S302判断;否则,进入步骤S5;S302:查询故障类型与指标维度的关联关系,针对所需诊断的故障类型,若存在主要指标维度特征或次要指标维度特征的数据缺失,则进入步骤S4;否则,直接进入步骤S5。
[0019]判断缺失的数据是否会影响到后续的诊断,如果会,则进行数据的修复,如果不会则忽略该数据的缺失。
[0020]作为优选,所述的步骤S4包括以下步骤:S401:确定存在主要指标维度特征或次要指标维度特征数据缺失的树状模型中树枝末端;S402:获取上一级树枝节点中的所有数据样本;S403:判断属于同一上一级树枝节点中的数据子队列是否存在相同指标维度的数据缺失;若是,则返回步骤S402;否则,选取该数据自子队列为修复队列,进入步骤S404;S404:计算待修复数据集合与修复队列的曼哈顿距离,判断是否小于距离阈值;若是,则取修复队列中对应的指标维度中数据的平均值为修复值;否则,返回步骤S402,直至追溯到最上级。
[0021]通过曼哈顿距离寻找最邻近的数据样本,以此来修补数据,提高数据的准确率。
[0022]作为优选,所述的曼哈顿距离计算过程为:为:其中,ρ<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于缺失数据修复的主变在线故障诊断方法,其特征在于,包括以下步骤:S1:对采集的油色谱数据样本依次以不同的指标维度分割,构建树状模型;S2:根据故障类型与指标维度的关联关系,确定不同故障类型对应树状模型中树枝末端的数据集合;S3:判断数据集合中缺失数据是否影响故障诊断,若是,则进入步骤S4,否则,直接进入步骤S5;S4:根据曼哈顿距离查找获得的最相邻树枝节点数据,修复缺失数据;S5:匹配历史数据进行故障类型的诊断。2.根据权利要求1所述的一种基于缺失数据修复的主变在线故障诊断方法,其特征在于,所述的油色谱数据样本中包括若干种可溶油中的气体组分含量;分别以一个气体组分作为一个指标维度。3.根据权利要求1或2所述的一种基于缺失数据修复的主变在线故障诊断方法,其特征在于,所述的树状模型构建过程为:S101:分别计算数据样本中各指标维度的方差;S102:取方差值最大的指标维度为分割维度,将各组数据样本按分割维度中数据的大小顺序排列;S103:以队列中间的数据样本为分割界限,将一个数据队列分割为两个数据子队列;S104:判断数据子队列中的数据样本数量是否小于数量阈值或分割次数是否达到分割阈值;若是,则完成该支节点的分割;若否,则对于各数据子队列返回步骤S101。4.根据权利要求3所述的一种基于缺失数据修复的主变在线故障诊断方法,其特征在于,树状模型中各树枝节点的每个指标维度分别标记有分割系数;在分割获得各树枝节点的过程中,将历次分割的分割维度所对应的分割系数加一。5.根据权利要求1所述的一种基于缺失数据修复的主变在线故障诊断方法,其特征在于,所述的故障类型包括过热故障和放电故障两大类;所述的过热故障包括高温过热、中温过热和低温过热;所述的放电故障包括局部放电、高能放电和低能放电。6.根据权利要求1或2或4或5所述的一种基于缺失数据修复的主变在线故障诊断方法,其特征在于,所述的步骤S2具体包括以下过程:S201:构建故障类型与指标维度关联表;关联表中包括各故障类型对应的主要指标维度特征和次要指标维度特征;S202:对各故障类型的主要指标维度特征和次要指标维度特征分别赋予维度权重值;S203:以特定故障类型为诊断目标,分别以对应的维度权重值计算树状模型中各树枝末端的数据样本的关联指数;S204:取关联指数大于关联阈值的数据样本的集合为诊断数据样本集合。7.根据权利要求6所述的一种基于缺失数据修复的主变在线故障诊断方法,其特征在于,关联指数的计算过程为:
其中,R
yn
第y种故障类型对应的树状模型中第n个树枝末端的数据样本的关联指数;ω
yk
为第y种故障类型对应的第k个指标维度的维度权重值;K为指标维度的总个数;f
nk
为树状模型中第n个树枝末端的数据样本在第k个指标维度的分割系数。8.根据权利要求6所述的一种基于缺失数据修复的主变在线故障诊断方法,其特征在于,所述的步骤S3具体包括以下过程:S301:判断诊断数据样本集合中是否存在数据缺失;若是,则进入步骤S302判断;否则,进入步骤S5;S302:查询故障类型与指标维度的关联关系,针对所需诊断的故障类型,若存在主要指标维度特征或次要指标维度特征的数据缺失,则进入...

【专利技术属性】
技术研发人员:郑怀华邹剑锋张捷周旻傅进叶承晋周刚戚中译李锐锋钱伟杰周冰杨小立
申请(专利权)人:国网浙江省电力有限公司嘉兴供电公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1