【技术实现步骤摘要】
电力设备缺陷信息的处理方法、装置、设备及存储介质
[0001]本专利技术涉及电力设备运维
,尤其涉及一种电力设备缺陷信息的处理方法、装置、设备及存储介质。
技术介绍
[0002]在电力设备故障发生后,通常会对电力设备所存在的缺陷进行快速识别并及时消缺,以保证电力系统的可靠性。为助于后续故障识别和消缺,电力设备缺陷信息以文本方式进行记录,其包含故障问题描述和故障原因分析等关键信息,蕴含着丰富的与电力设备运行维护相关的经验知识。
[0003]目前,由于电力设备缺陷文本的领域性较强,且由人工记录,所以其表达方式不符合通用语法,存在篇幅较长、句法结构复杂以及难以准确划分文本的主谓成分的问题,再加上待抽取的实体类型多样,不仅有词语短语类型,还包括特定类型的句子,因此需要对电力设备缺陷文本进行知识管理。但是,当前知识管理工作主要基于语法结构清晰的大型传统文本数据集进行,其无法适用于具有异构性、多样性和碎片化等特征的电力设备缺陷文本。因此,亟需一种适用于电力设备缺陷信息的处理方法。
技术实现思路
[0004] ...
【技术保护点】
【技术特征摘要】
1.一种电力设备缺陷信息的处理方法,其特征在于,包括:获取电力设备缺陷信息,所述电力设备缺陷信息包括结构化文本信息和非结构化文本信息;利用预设的改进BILSTM算法,对所述结构化文本信息进行文本增强,得到目标结构化文本信息;利用预设的改进BERT算法,对所述非结构化文本信息进行实体抽取,得到目标实体信息;基于所述目标结构化文本信息和目标实体信息,构建电力设备缺陷知识图谱。2.如权利要求1所述的电力设备缺陷信息的处理方法,其特征在于,所述改进BILSTM算法包括UCNN算法和第一BILSTM算法,所述利用预设的改进BILSTM算法,对所述结构化文本信息进行文本增强,得到目标结构化文本信息,包括:对所述结构化文本信息进行预处理,得到预处理后的结构化文本信息,所述预处理包括文本分词、去停用词和同义词替换;利用所述UCNN算法,对预处理后的所述结构化文本信息进行词语特征提取,得到预处理后的所述结构化文本信息的词语特征;利用所述第一BILSTM算法,根据所述词语特征,对预处理后的所述结构化文本信息进行文本分类,得到所述目标结构化文本信息。3.如权利要求2所述的电力设备缺陷信息的处理方法,其特征在于,所述UCNN算法的表达式为:其中,o(u,v)为所述词语特征,为非共享卷积核,w
i,j
为中在(i,j)处的权重值,K
r
×
s
表示预处理后的所述结构化文本信息对应的词向量集,k
u
‑
i,v
‑
j
为K
r
×
s
中的词向量。4.如权利要求1所述的电力设备缺陷信息的处理方法,其特征在于,所述改进BERT算法包括BERT算法、第二BILSTM算法和CRF算法,所述利用预设的改进BERT算法,对所述非结构化文本信息进行实体抽取,得到目标实体信息,包括:利用所述BERT算法,对所述非结构化文本信息进行编码,得到字向量和位置向量;利用所述第二BILSTM算法,根据字向量和所述位置向量,对所述非结构化文本信息进行上下文语义特征提取,得到所述非结构化文本信息的上下文语义特征;利用所述CRF算法,根据所述上下文语义特征,对所述非结构化文本信息进行命名实体识别,得到所述非结构化文本信息的实体标签;根据所述实体标签,对所述非结构化文本信息进行实体抽取,得到所述目标实体信息。5.如权利要求4所述的电力设备缺陷信息的处...
【专利技术属性】
技术研发人员:陈鹏,孔力,金杨,邰彬,章坚,汪进锋,吕鸿,姚瑶,黄杨珏,王志华,
申请(专利权)人:广东电网有限责任公司电力科学研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。