电力设备局放文本的实体关系联合抽取方法、设备、介质技术

技术编号:39271449 阅读:27 留言:0更新日期:2023-11-07 10:51
本发明专利技术涉及一种电力设备局放文本的实体关系联合抽取方法、设备、介质,包括:将局部放电文本句子输入编码模型中,得到各个字符对应的编码并按照文字顺序排列得到编码序列;将编码序列输入头实体编码器中,标记头实体的起止位置,基于头实体的起止位置对应字符的编码进行特征解析及语义提取,得到头实体语义向量;利用尾实体解码器,通过将头实体作为先验信息,匹配与预设的关系类型对应的尾实体的起止位置。通过将三元组抽取过程看作为两个实体的映射关系,首先抽取出头实体,作为先验信息,再针对每一种关系抽取对应的尾实体,从而实现头实体在特定关系类型下到尾实体的映射过程,使模型更加关注于关系相关的语义信息,减少冗余的抽取操作。的抽取操作。的抽取操作。

【技术实现步骤摘要】
电力设备局放文本的实体关系联合抽取方法、设备、介质


[0001]本专利技术涉及电网故障诊断领域,尤其是涉及一种电力设备局放文本的实体关系联合抽取方法、设备、介质。

技术介绍

[0002]随着国内外研究人员对局部放电领域的深入研究和配电设备检测技术的日益成熟,局放检测近年来获得了广泛的现场应用,并由此积累了大量的电力设备局放检测文本。这些文本中详细记录了经由局放检测发现的设备缺陷数据、运行状态、缺陷产生过程与设备解体维护经过等重要信息,对电力设备运行状态评估、家族性缺陷识别等具有重要意义。然而该类文本往往具有非结构化数据占比大、多源异构性高等特点,难以直接从中提取有效知识并进行知识整合,因此亟需一种能够聚集文本知识、可视化程度高的工具对电力设备局放数据进行分析处理。随着图论相关理论的不断完善,知识图谱技术在海量数据组织管理、知识表达与智能问答领域展现出巨大潜力与优势。因此,我们可以借助知识图谱来对电力设备局放文本数据进行分析、录入、展示与推理等,从而有效地学习到有关电力设备的先验知识以及消缺案例,并在此基础上进行逻辑推理、智能匹配等,进一步为输变本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种电力设备局放文本的实体关系联合抽取方法,其特征在于,包括如下步骤:获取局部放电文本句子并输入编码模型中,得到各个字符对应的编码并按照文字顺序排列得到编码序列;将所述编码序列输入头实体编码器中,标记头实体的起止位置,基于所述头实体的起止位置对应字符的编码进行特征解析与语义信息提取,得到头实体语义向量;将所述编码序列和所述头实体语义向量输入尾实体解码器中,通过将头实体作为先验信息,匹配与预设的关系类型对应的尾实体的起止位置,构建包括头实体、尾实体和关系类型的三元组,实现实体关系的联合抽取。2.根据权利要求1所述的一种电力设备局放文本的实体关系联合抽取方法,其特征在于,所述的编码模型预先经过预训练,预训练的过程包括如下步骤:获取包括多个样例文本句子的训练数据,依次对所述编码模型进行掩藏语言模型训练和下一句预测训练。3.根据权利要求1所述的一种电力设备局放文本的实体关系联合抽取方法,其特征在于,针对所述的头实体编码器和所述的尾实体解码器中的任一个,均包括两个不同的二进制分类器,用于分别标记头实体或尾实体的开始位置和结束位置。4.根据权利要求1所述的一种电力设备局放文本的实体关系联合抽取方法,其特征在于,所述的头实体语义向量的获取过程包括如下步骤:抽取出所述头实体的起止位置之间的所有字符对应的长度相同的编码向量,将其输入到双向长短期记忆网络模型中进行特征解析,选取该双向长短期记忆网络模型的最后一个位置输出的隐藏层向量作为...

【专利技术属性】
技术研发人员:周录波王栋谢励耘朱荣华刘隰蒲宋辉钱勇盛戈皞
申请(专利权)人:国网上海市电力公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1