本发明专利技术涉及一种多异源特征融合结合聚类算法的电气设备绝缘故障状态分类方法、装置及存储介质,其中方法包括:获取电气设备运行的历史数据和实时数据;分别对历史数据和实时数据进行特征提取、拼接、自动编码器降维和标准化处理,得到历史数据特征组和实时数据特征组;基于参数自适应选取的DBSCAN聚类算法,对历史数据特征组和实时数据特征组分别进行聚类,实现电气设备绝缘故障状态分类,得到聚类的历史核心对象列表和实时核心对象列表;抽取、合并历史核心对象列表和实时核心对象列表,并应用参数自适应选取的DBSCAN聚类算法,得到实时数据的精准绝缘故障状态分类结果。与现有技术相比,本发明专利技术具有分类结果准确、可解释性好等优点。释性好等优点。释性好等优点。
【技术实现步骤摘要】
一种电气设备绝缘故障状态分类方法、装置及存储介质
[0001]本专利技术涉及高压电气设备绝缘故障状态分类领域,尤其是涉及一种多异源特征融合结合聚类算法的电气设备绝缘故障状态分类方法、装置及存储介质。
技术介绍
[0002]在长时间的高电压和恶劣环境的作用下,高压电气设备可能发生温升、放电等故障。电气设备故障可以通过泄漏电流、红外成像图、紫外成像图、可见光图像、特高频等多种检测手段进行判别。而对电气设备运行状态分级,力求在不同环境条件,对多检测信号,尤其是对不同拍摄视角的图像,能在状态分级中有客观的受影响较小的统一的划分方法,以此减少运维人员工作。
[0003]针对检测到的图像信号具有维度高、信息冗余复杂等特点,对数据进行降维是非常必要的。而利用无监督学习对设备运行状态特征进行聚类,有助于对设备运行状态获得的大量实时和历史检测数据划分。电气设备检测数据是一系列多检测方式检测源数据及特征提取后特征构成的无标记数据,使用无监督聚类模型划分故障状态,可提高数据的利用率,便于后续分析、建模使用这些无标记数据。对于电气设备不同故障原因的检测信号特征的数据分布不一定相同,对于实时检测的电气设备信号,历史数据库的划分范围结果不一定适用。
[0004]利用多特征直接进行聚类或者机器学习故障分类划分,缺乏对多源检测特征有效、高效的关联分析,使得各检测特征在聚类分类中的贡献差别大,并且特征冗余度高。且以往的故障状态分级方法一般只利用历史数据,难以根据实时数据对模型进行更新。
技术实现思路
[0005]本专利技术的目的就是为了提供一种多异源特征融合结合聚类算法的电气设备绝缘故障状态分类方法、装置及存储介质,实现精确的故障状态分类。
[0006]本专利技术的目的可以通过以下技术方案来实现:
[0007]一种多异源特征融合结合聚类算法的电气设备绝缘故障状态分类方法,包括以下步骤:
[0008]获取电气设备运行的历史数据和实时数据,所述历史数据和实时数据包括设备运行电压等级、环境温度、泄漏电流波形和红外图像;
[0009]分别对历史数据和实时数据进行特征提取、拼接、自动编码器降维和标准化处理,得到历史数据特征组和实时数据特征组;
[0010]基于参数自适应选取的DBSCAN聚类算法,对历史数据特征组和实时数据特征组分别进行聚类,实现电气设备绝缘故障状态分类,得到聚类的历史核心对象列表和实时核心对象列表;
[0011]抽取、合并历史核心对象列表和实时核心对象列表,并应用参数自适应选取的DBSCAN聚类算法,得到实时数据的精准绝缘故障状态分类结果。
[0012]对历史数据和实时数据中的泄漏电流波形进行特征提取时,提取电流波形的幅值和有效值特征。
[0013]对历史数据和实时数据中的红外图像进行特征提取时,提取图像的HSV特征和图像熵特征。
[0014]将多检测信号的特征进行拼接,得到一条设备运行状态判别向量:
[0015]X=(V,T,I
max
,I
E
,H
i
,S
i
,V
i
,E)
[0016]其中,i为遍历的像素点,V为设备运行的外加电压值,T为环境温度,I
max
为泄漏电流最大值,I
E
为泄漏电流有效值,红外图像的HSV特征平均值为H
i
,S
i
和V
i
,E为红外图像的熵值。
[0017]所述自动编码器的隐藏特征设定为4维特征,自动编码器编码和解码均有N层隐藏层,利用N层编码隐藏层对拼接后的特征进行非线性变换,通过虚构1个X
q
→
h
→
X
q
的三层网络,学习得出1种特征变化h=f(wx+b),其中,X
q
为输入的拼接特征,X
q
为输出,x为原异源融合特征,h为自动编码器隐藏层特征,即x的编码特征,w为权重矩阵,b为偏置向量,f为激活函数。
[0018]采用自适应迭代矩估计对自动编码器进行训练,以最小均方差为目标使输入X
q
与输出X
q
之间的误差最小,从而得到最优自动编码器结构及编码数据X
q
。
[0019]DBSCAN聚类算法选用欧式聚类,聚类初始核心对象随机选取,根据数据集,自适应计算聚类算法所需参数:领域对象数eps和Minpts,其中,eps为所有点对所有其他数据点的K
‑
最近邻距离求平均值后取的最大值,Pi为第i个对象的eps领域内的对象数量,n为数据集中的总对象数,则:
[0020][0021]DBSCAN聚类算法的聚类簇的个数根据电气设备故障状态分类设定约束条件为1<a<4,其中,a表示聚类簇个数,所述约束条件表示在对电气设备故障状态类型分类时,至少将样本数据划分为故障和非故障两类,至多划分为正常、一般故障和严重故障三类。
[0022]一种多异源特征融合结合聚类算法的电气设备绝缘故障状态分类装置,包括存储器、处理器,以及存储于所述存储器中的程序,所述处理器执行所述程序时实现如上述所述的方法。
[0023]一种存储介质,其上存储有程序,所述程序被执行时实现如上述所述的方法。
[0024]与现有技术相比,本专利技术具有以下有益效果:
[0025](1)本专利技术通过自动编码器实现特征融合降维,优化特征,获取能更好表现特征信息的隐藏特征,减少特征冗余,有利于提高数据集对不同故障类型的表达能力,提高了后期聚类分类准确性。
[0026](2)本专利技术采用根据不同数据集自适应进行参数选取的DBSCAN算法,在初步聚类后基于历史数据和实时数据再聚类,可以实现对历史数据集与实时检测数据集的准确分类,同时对检测离散点可以有效检出,计算简便,分类模型更新快速。
[0027](3)本专利技术获取的数据信息多元,包括泄漏电流和红外图像等多检测信息,同时,对多检测源信息特征提取。
附图说明
[0028]图1为本专利技术的方法流程图。
具体实施方式
[0029]下面结合附图和具体实施例对本专利技术进行详细说明。本实施例以本专利技术技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本专利技术的保护范围不限于下述的实施例。
[0030]一种多异源特征融合结合聚类算法的电气设备绝缘故障状态分类方法,如图1所示,包括以下步骤:
[0031]1)获取电气设备运行的历史数据和实时数据,所述历史数据和实时数据包括设备运行电压等级、环境温度、泄漏电流波形和红外图像。
[0032]本实施例针对的电气设备是如变电站的绝缘子和避雷器等高压绝缘设备。在线监测的泄漏电流片段以0.3s的片段为一条检测信号。样本数据有100条。
[0033]2)分别对历史数据和实时数据进行特征提取、拼接、自动编码器降维和标准化处理,本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种多异源特征融合结合聚类算法的电气设备绝缘故障状态分类方法,其特征在于,包括以下步骤:获取电气设备运行的历史数据和实时数据,所述历史数据和实时数据包括设备运行电压等级、环境温度、泄漏电流波形和红外图像;分别对历史数据和实时数据进行特征提取、拼接、自动编码器降维和标准化处理,得到历史数据特征组和实时数据特征组;基于参数自适应选取的DBSCAN聚类算法,对历史数据特征组和实时数据特征组分别进行聚类,实现电气设备绝缘故障状态分类,得到聚类的历史核心对象列表和实时核心对象列表;抽取、合并历史核心对象列表和实时核心对象列表,并应用参数自适应选取的DBSCAN聚类算法,得到实时数据的精准绝缘故障状态分类结果。2.根据权利要求1所述的一种多异源特征融合结合聚类算法的电气设备绝缘故障状态分类方法,其特征在于,对历史数据和实时数据中的泄漏电流波形进行特征提取时,提取电流波形的幅值和有效值特征。3.根据权利要求2所述的一种多异源特征融合结合聚类算法的电气设备绝缘故障状态分类方法,其特征在于,对历史数据和实时数据中的红外图像进行特征提取时,提取图像的HSV特征和图像熵特征。4.根据权利要求3所述的一种多异源特征融合结合聚类算法的电气设备绝缘故障状态分类方法,其特征在于,将多检测信号的特征进行拼接,得到一条设备运行状态判别向量:X=(V,T,I
max
,I
E
,H
i
,S
i
,V
i
,E)其中,i为遍历的像素点,V为设备运行的外加电压值,T为环境温度,I
max
为泄漏电流最大值,I
E
为泄漏电流有效值,红外图像的HSV特征平均值为H
i
,S
i
和V
i
,E为红外图像的熵值。5.根据权利要求1所述的一种多异源特征融合结合聚类算法的电气设备绝缘故障状态分类方法,其特征在于,所述自动编码器的隐藏特征设定为4维特征,自动编码器编码和解码均有N层隐藏层,利用N层编码隐藏层对拼接后的特征进...
【专利技术属性】
技术研发人员:高凯,曹培,吴天逸,司文荣,黄华,金立军,马丹睿,贺建明,
申请(专利权)人:同济大学华东电力试验研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。