电力设备故障分析方法技术

技术编号:39763846 阅读:6 留言:0更新日期:2023-12-22 02:19
本发明专利技术公开了一种电力设备故障分析方法,涉及深度学习技术领域,用于解决现有电力设备故障检测不准确的问题,该方法包括以下步骤:获取故障描述文本,并对所述描述文本进行预处理,得到待处理文本;对所述待处理文本进行向量初始化,得到文本初始化向量;通过

【技术实现步骤摘要】
电力设备故障分析方法、装置、设备及存储介质


[0001]本专利技术涉及一种深度学习
,尤其涉及一种基于深度学习的电力设备故障分析方法

装置

设备及介质


技术介绍

[0002]随着电力设备的升级及更广泛的应用,电力设备的故障也随之出现

根据电力设备历史故障案例报告可以发现设备故障规律:在一段时间内,同一种型号

同一系列或是同一厂家生产的电力设备会频繁地出现相同的故障类型

除此以外,发生同种故障类型的共同表征现象还体现在天气

使用环境条件等因素上

目前故障检测手段主要依靠人工检索

判断故障案例间的相似性只能依靠经验,故障检测的速度缓慢

准确性不高

[0003]目前常用的基于
TF

IDF
算法检索分析电力设备家族病的设备存在无法考虑语义信息

忽略词语顺序

无法处理停用词以及数据稀疏等问题,导致设备的识别准确率不高

该类设备基于
TF

IDF
算法,存在四个问题,第一,只考虑了词语在文本中的出现频率,没有考虑词语的语义信息,在某些情况下,意思不同但表示相同或相似的词语会被视为相同的词语,导致词向量的表示不准确,进而影响后续计算的准确性;第二,只关注词语的出现频率,而忽略了它们在文本中的顺序,在自然语言处理中,词语的顺序对于表达文本的含义和语境非常重要,因此忽略语序会影响计算结果的准确性;第三,
TF

IDF
算法没有考虑停用词的影响,这可能导致计算结果存在偏差;第四,在大规模文本处理中,词语的数量往往非常庞大,但每个文本中实际出现的词语数量却很少,这就导致
TF

IDF
算法中的数据稀疏性问题,即很多词语在大多数文本中都没有出现,导致计算结果的精度下降

[0004]现有技术也有采用基于
DSSM
模型进行故障检索分析

但是该方法存在忽略语序信息和上下文信息的问题,导致设备的识别准确率不高,响应速度慢

该类设备通常采用
BoW
词袋模型表征文本信息,存在三个问题,第一,只考虑了单词出现的频率,而忽略了它们在句子中的顺序和语法结构

例如,“变压器的绕组”和“绕组的变压器”在词袋模型中是相同的向量,这可能导致计算结果不准确;第二,只考虑了单词出现的频率,而忽略了它们的含义

例如,“变压器”和“断路器”,尽管表示不同的电力设备,但在
BoW
词袋模型中被视为相同的单词,这也会影响计算结果的准确性;第三,
BoW
词袋模型的向量维度取决于文本中单词的数量,当文本很长时,向量维度会变得非常高,这会存在计算资源和存储空间占据大的问题,除此之外,由于大部分单词在文本中只出现一次或几次,因此向量中大部分维度都是零,这会浪费存储空间和计算资源

高维度的向量表示会造成后续相似度的计算量非常大,导致设备响应缓慢

[0005]因此,亟需采取有效的智能化方法对故障案例报告进行统一分析处理,及时发现和处理存在家族病的电力设备,保障电网的安全稳定运行


技术实现思路

[0006]为了克服现有技术的不足,本专利技术的目的之一在于提供一种电力设备故障分析方
法,其通过提炼文本语义信息,进而获取高匹配度的故障分析结果

[0007]本专利技术的目的之一采用以下技术方案实现:
[0008]一种电力设备故障分析方法,包括以下步骤:
[0009]获取故障描述待处理文本;
[0010]对所述待处理文本进行向量初始化,得到文本初始化向量;
[0011]通过
BERT
模型对所述初始化向量进行语义提取,得到聚合语义向量;
[0012]对所述聚合语义向量进行文本相似度计算及文本聚类;
[0013]根据所述文本聚类结果,进行故障分析匹配

[0014]进一步地,获取故障描述待处理文本,还包括:
[0015]将原始故障描述文本描述时间信息的语句删除

[0016]进一步地,所述故障描述文本包括故障现象

故障原因

故障类型

线路名

地名

变电站名

专家判定故障的依据

解决措施

设备型号

设备厂家

设备出厂编号

天气条件以及环境条件

[0017]进一步地,对所述待处理文本进行向量初始化,得到文本初始化向量,包括:
[0018]对所述待处理文本进行字符嵌入

句子嵌入及位置嵌入,得到可被
BERT
模型识别的单文本初始化向量

[0019]进一步地,通过
BERT
模型对所述初始化向量进行语义提取,得到聚合语义向量,包括:
[0020]对所述初始化向量进行映射,得到查询映射矩阵

值映射矩阵及键矩阵;
[0021]根据所述查询映射矩阵

值映射矩阵及键矩阵,通过
BERT
模型的注意力机制计算得到各编码层聚合语义向量;
[0022]提取句首的所述各编码层聚合语义向量,作为最终的所述聚合语义向量

[0023]进一步地,所述文本相似度计算满足:
[0024][0025]其中,
u

v
表示聚合语义向量,
a
表示两语义向量的相似度

[0026]进一步地,通过
DBSCAN
算法进行所述的文本聚类

[0027]进一步地,故障分析匹配包括:
[0028]将所述聚合语义向量与所述文本聚类得到的6个簇的中心向量进行相似度计算,得到归属向量簇;
[0029]对所述归属向量簇内的语义向量进行相似度遍历计算,返回相似度最高的结果作为所述故障分析匹配结果

[0030]本专利技术的目的之二在于提供一种电力设备故障分析装置

[0031]本专利技术的目的之二采用以下技术方案实现:
[0032]一种电力设备故障分析装置,其包括:
[0033]获取模块,用于获取故障描述待处理文本;
[0034]处理模块,用于对所述待处理文本进行向量初始化,得到文本初始化向量;并通过
BERT
模型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种电力设备故障分析方法,其特征在于,包括以下步骤:获取故障描述待处理文本;对所述待处理文本进行向量初始化,得到文本初始化向量;通过
BERT
模型对所述初始化向量进行语义提取,得到聚合语义向量;对所述聚合语义向量进行文本相似度计算及文本聚类;根据所述文本聚类结果,进行故障分析匹配
。2.
如权利要求1所述的电力设备故障分析方法,其特征在于,获取故障描述待处理文本,还包括:将原始故障描述文本描述时间信息的语句删除
。3.
如权利要求1或2所述的电力设备故障分析方法,其特征在于,所述故障描述文本包括故障现象

故障原因

故障类型

线路名

地名

变电站名

专家判定故障的依据

解决措施

设备型号

设备厂家

设备出厂编号

天气条件以及环境条件
。4.
如权利要求1所述的电力设备故障分析方法,其特征在于,对所述待处理文本进行向量初始化,得到文本初始化向量,包括:对所述待处理文本进行字符嵌入

句子嵌入及位置嵌入,得到可被
BERT
模型识别的单文本初始化向量
。5.
如权利要求1所述的电力设备故障分析方法,其特征在于,通过
BERT
模型对所述初始化向量进行语义提取,得到聚合语义向量,包括:对所述初始化向量进行映射,得到查询映射矩阵

值映射矩阵及键矩阵;根据所述查询映射矩阵...

【专利技术属性】
技术研发人员:李晨蔺家骏胡俊华王雅雯王渊郑一鸣邵先军马国明张凯煜王正文
申请(专利权)人:国网浙江省电力有限公司电力科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1