一种电力设备知识图谱本体构建方法、系统、设备及介质技术方案

技术编号:36683097 阅读:12 留言:0更新日期:2023-02-27 19:42
本发明专利技术公开了一种电力设备知识图谱本体构建方法、系统、设备及介质,所述电力设备知识图谱本体构建方法包括以下步骤:获取电力设备数据;其中,所述电力设备数据包括电力设备的检修台账数据、检修导则和技术标准;基于所述电力设备数据,构建获得电力设备的输电本体框架、变电本体框架和配电本体框架;将构建获得的所述输电本体框架、所述变电本体框架和所述配电本体框架进行本体融合,获得电力设备知识图谱本体。本发明专利技术提供的方法可解决异构知识图谱系统不利于业务流程的优化以及特性设计的技术问题,能够提升基于电力运检领域知识图谱的上层应用数据访问效率和便捷性。的上层应用数据访问效率和便捷性。的上层应用数据访问效率和便捷性。

【技术实现步骤摘要】
一种电力设备知识图谱本体构建方法、系统、设备及介质


[0001]本专利技术属于人工智能领域,涉及电力运检领域,特别涉及一种电力设备知识图谱本体构建方法、系统、设备及介质。

技术介绍

[0002]随着知识图谱技术的兴起,专家学者近年来在电力运检领域积极探索,研究了面向输电、配电、变电等细分电力业务的知识图谱构建及基于电力运检领域知识图谱的辅助决策关键技术;其中,本体作为知识图谱的核心部分,在解决领域知识共享的同时也引入了新问题。
[0003]电力运检领域,输电、配电、变电等各个细分业务领域的本体通常由本领域业务专家构建和维护,每个业务领域专家对知识的主观理解不同会造成一定差异;同时,由于输电、配电、变电等业务在实践生成运行环境存在交集,其对应的本体所描述的内容通常在语义上也存在重叠或关联关系,因此使用的本体表示语言和表示模型存在差异,导致造成本体异构问题。

技术实现思路

[0004]本专利技术的目的在于提供一种电力设备知识图谱本体构建方法、系统、设备及介质,以解决上述现有技术存在的异构知识图谱不利于业务流程的优化以及特性设计的技术问题。本专利技术提供的方法可解决异构知识图谱系统不利于业务流程的优化以及特性设计的技术问题,能够提升基于电力运检领域知识图谱的上层应用数据访问效率和便捷性。
[0005]为达到上述目的,本专利技术采用以下技术方案:
[0006]本专利技术第一方面提供的一种电力设备知识图谱本体构建方法,包括以下步骤:
[0007]获取电力设备数据;其中,所述电力设备数据包括电力设备的检修台账数据、检修导则和技术标准;
[0008]基于所述电力设备数据,构建获得电力设备的输电本体框架、变电本体框架和配电本体框架;
[0009]将构建获得的所述输电本体框架、所述变电本体框架和所述配电本体框架进行本体融合,获得电力设备知识图谱本体。
[0010]本专利技术的进一步改进在于,所述基于所述电力设备数据,构建获得电力设备的输电本体框架、变电本体框架和配电本体框架的步骤包括:
[0011]基于所述检修台账数据并结合检修导则和技术标准,获得节点及节点之间的逻辑关系;
[0012]基于获得的逻辑关系,分别构建获得电力设备的输电本体框架、变电本体框架和配电本体框架;其中,所述检修台账数据包括结构化数据、半结构化数据和非结构化数据;所述结构化数据采用映射方式构建本体;所述半结构化数据和非结构化数据采用信息抽取方式识别节点和节点之间的逻辑关系形成本体。
[0013]本专利技术的进一步改进在于,所述结构化数据采用映射方式构建本体的步骤包括:
[0014]将结构化数据进行预处理;预处理后表征电力设备的列为核心节点,剩余的其它列作为图谱节点或属性,值作为节点名称或节点属性,节点与节点之间的关系名称复用列名;
[0015]其中,所述预处理包括:将英文字段进行大小写归一化处理;将字符串编码统一处理为UTF

8。
[0016]本专利技术的进一步改进在于,所述半结构化数据和非结构化数据采用信息抽取方式识别节点和节点之间的逻辑关系形成本体的步骤包括:
[0017]对于半结构化数据和非结构化数据,采用端到端信息抽取模型DYGIEPP进行事件节点抽取形成本体;
[0018]其中,所述端到端信息抽取模型DYGIEPP包括:
[0019]输入层,用于将半结构化数据或非结构化数据转换成字符向量序列;
[0020]字符片段编码层,用于基于所述字符向量序列,获得字符片段序列以及每个字符片段的片段编码;
[0021]片段图传播,用于以获得的片段编码为输入,通过多层神经网络计算进行片段图传播;其中,每一轮迭代t,以上一轮迭代t

1的结果为输入;
[0022]分类层,用于分类并输出;其中,对于抽象为片段分类的子任务采用进行分类,对于抽象为关系分类的子任务采用进行分类;FFNN表示基于Softmax的分类器,T表示片段图传播的最后输出;
[0023]其中,所述输入层中,字符向量序列表示为式中,x
i
表示第i个字符对应的bert编码向量,n表示文本长度,d
bert
表示BERT

Chinese输出层的维度;
[0024]所述字符片段编码层中,字符片段序列表述为[s1,s2,

,s
i
,

,s
m
];每个片段s
i
表示为每个e
i
由其第一个字符对应的bert编码向量、最后一个字符对应的bert编码向量以及一个和片段长度有关的向量拼接得到,表示为量、最后一个字符对应的bert编码向量以及一个和片段长度有关的向量拼接得到,表示为式中,s
i
表示第i个字符片段,e
i
表示遍历得到的第i个字符片段的向量表示;表示e
i
第一个字符在文本中对应的位置序号,表示第一个字符对应的bert编码向量;表示e
i
对应的最后一个字符对应的位置序号,表示最后一个字符对应的bert编码向量;表示该片段长度向量;
[0025]所述片段图传播中,不同的任务x在不同片段中传播信息的计算过程为,
[0026][0027][0028][0029]式中,层表示第i个片段对应的第t层的输出;表示针对任务x,第i片段从其
它片段对应的第t层输入中得到的信息编码;表示根据第t层输入的片段向量和得到的两个片段间的权重,W
x
为随机初始化权重。
[0030]本专利技术的进一步改进在于,所述将所述输电本体框架、所述变电本体框架和所述配电本体框架进行本体融合,获得最终的电力设备知识图谱本体的步骤包括:
[0031]基于所述输电本体框架、所述变电本体框架和所述配电本体框架,将相同的节点进行归并,将不同的节点合并到一个本体中;
[0032]其中,所述将相同的节点进行归并包括:基于输电本体框架、变电本体框架和配电本体框架采用同义词表检索方式对所有三元组数据中的节点进行共指消解、基于图进行节点消歧和基于概率生成模型进行消歧。
[0033]本专利技术的进一步改进在于,所述基于图进行节点消歧的步骤包括:
[0034]基于获取的电力设备数据和预设权重建立获得参照图;其中,所述参照图中表示了节点

实体、实体

实体的关系;所述参照图中节点和候选的加权边表示局部依赖性,实体和实体间的加权边表示实体间的语义相关度;
[0035]将节点的初始重要性度量作为实体消歧的初始依据并在所述参照图上进行传递;基于实体消歧依据的传递结果,计算结合局部相容度和全局依赖性的消歧目标函数,为每个节点确定能使目标函数最大化的目标实体,获得消歧结果。
[0036]本专利技术的进一步改进在于,所述基于概率生成模型进行消歧的步骤包括:
[0037]基于概本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电力设备知识图谱本体构建方法,其特征在于,包括以下步骤:获取电力设备数据;其中,所述电力设备数据包括电力设备的检修台账数据、检修导则和技术标准;基于所述电力设备数据,构建获得电力设备的输电本体框架、变电本体框架和配电本体框架;将构建获得的所述输电本体框架、所述变电本体框架和所述配电本体框架进行本体融合,获得电力设备知识图谱本体。2.根据权利要求1所述的一种电力设备知识图谱本体构建方法,其特征在于,所述基于所述电力设备数据,构建获得电力设备的输电本体框架、变电本体框架和配电本体框架的步骤包括:基于所述检修台账数据并结合检修导则和技术标准,获得节点及节点之间的逻辑关系;基于获得的逻辑关系,分别构建获得电力设备的输电本体框架、变电本体框架和配电本体框架;其中,所述检修台账数据包括结构化数据、半结构化数据和非结构化数据;所述结构化数据采用映射方式构建本体;所述半结构化数据和非结构化数据采用信息抽取方式识别节点和节点之间的逻辑关系形成本体。3.根据权利要求2所述的一种电力设备知识图谱本体构建方法,其特征在于,所述结构化数据采用映射方式构建本体的步骤包括:将结构化数据进行预处理;预处理后表征电力设备的列为核心节点,剩余的其它列作为图谱节点或属性,值作为节点名称或节点属性,节点与节点之间的关系名称复用列名;其中,所述预处理包括:将英文字段进行大小写归一化处理;将字符串编码统一处理为UTF

8。4.根据权利要求2所述的一种电力设备知识图谱本体构建方法,其特征在于,所述半结构化数据和非结构化数据采用信息抽取方式识别节点和节点之间的逻辑关系形成本体的步骤包括:对于半结构化数据和非结构化数据,采用端到端信息抽取模型DYGIEPP进行事件节点抽取形成本体;其中,所述端到端信息抽取模型DYGIEPP包括:输入层,用于将半结构化数据或非结构化数据转换成字符向量序列;字符片段编码层,用于基于所述字符向量序列,获得字符片段序列以及每个字符片段的片段编码;片段图传播,用于以获得的片段编码为输入,通过多层神经网络计算进行片段图传播;其中,每一轮迭代t,以上一轮迭代t

1的结果为输入;分类层,用于分类并输出;其中,对于抽象为片段分类的子任务采用进行分类,对于抽象为关系分类的子任务采用进行分类;FFNN表示基于Softmax的分类器,T表示片段图传播的最后输出;其中,所述输入层中,字符向量序列表示为
式中,x
i
表示第i个字符对应的bert编码向量,n表示文本长度,d
bert
表示BERT

Chinese输出层的维度;所述字符片段编码层中,字符片段序列表述为[s1,s2,

,s
i
,

,s
m
];每个片段s
i
表示为每个e
i
由其第一个字符对应的bert编码向量、最后一个字符对应的bert编码向量以及一个和片段长度有关的向量拼接得到,表示为后一个字符对应的bert编码向量以及一个和片段长度有关的向量拼接得到,表示为式中,s
i
表示第i个字符片段,e
i
表示遍历得到的第i个字符片段的向量表示;表示e
i
第一个字符在文本中对应的位置序号,表示第一个字符对应的bert编码向量;表示e
i
对应的最后一个字符对应的位置序号,表示最后一个字符对应的bert编码向量;表示该片段长度向量;所述片段图传播中,不同的任务x在不同片段中传播信息的计算过程为,所述片段图传播中,不同的任务x在不同片段中传播信息的计算过程为,所述片段图传播中,不同的任务x在不同片段中传播信息的计算过程为,式中,层表示第i个片段对应的第t层的输出;表示针对任务x,第i片段从其它片段对应的第t层输入中得到的信息编码;表示根据第t层输入的片段向量和得到的两个片段间的权重,W
x
为随机初始化权重。5.根据权利要求1所述的一种电力设备知识图谱本体构建方法,其特征在于,所述将所述输电本体框架、所述变电本体框架和所述配电本体框架进行本体融合,获得最终的电力设备知识图谱本体的步骤包括:基于所述输电本体框架、所述变电本体框架和所述配电本体框架,将相同的节点进行归并,将不同的节点合并到一个本体中;其中,所述将相同的节点进行归并包括:基于输电本体框架、变电本体框架和配电本体框架采用同义词表检索方式对所有三元组数据中的节点进行共指消解、基于图进行节点消歧和基于概率生成模型进行消歧。6.根据权利要求5所述的一种电力设备知识图谱本体构建方法,其特征在于,所述基于图进行节点消歧的步骤包括:基于获取的电力设备数据和预设权重建立获得参照图;其中,所述参照图中表示了节点

实体、实体

实体的关系;所述参照图中节点和候选的加权边表示局部依赖性,实体和实体间的加权边表示实体间的语义相关度;将节点的初始重要性度量作为实体消歧的初始依据并在所述参照图上进行传递;基于实体消歧依据的传递结果,计算结合局部相容度和全局依赖性的消歧目标函数,为每个节点确定能使目标函数最大化的目标实体,获得消歧结果。7.根据权利要求5所述的一种电力设备知识图谱本体构建方法,其特征在于,所述基于概率生成模型进行消歧的步骤包括:基于概率生成模型对实体提及和实体的联合概率建立模型,通过建立的模型的推理求
解消歧问题,获得消歧结果;其中,所述实体提及的生成过程包括:依据实体的概率分布选择实体提及对应的实体;依据给定实体的实体名称的条件概率选择实体提及的名称;依据给定实体上下文的条件概率输出实体提及的上下文;实体和实体提及的联合概率表示为,P(m,e)=P(s,c,e)=P(e)P(s|e)P(c|e);式中,P(m,e)表示文本中的一段实体描述m链接于数据库中的实体e的联合概率;p(s,c,e)表示具有实体名s和其它上下文c的实体描述m=(s,c)对应于数据库中实体e的联合概率;p(e)表示数据库中实体e在文本中出现的先验概率;p(s|e)表示给定实体e以s为名称在文本中出现的条件概率;p(c|e)表示给定实体e出现在上下文为c的文本中的条件概率;P(e)对应实体的流行度,P(s|e)对应实体名称知识,P(c|e)对应上下文知识;当给定实体提及m时,与候选实体之间的语义计算的计算表达式为,8.根据权利要求5所述的一种电力设备知识图谱本体构建方法,其特征在于,所述将相同的节点进行归并时,还包括:基于深度学习的实体消歧,包括:采用word2vec将概念进行向量表示;每个概念对应的输入信息包括概念E、概念拥有的关系R、概念类型ET和概念描述D;基于词袋和独热表示的输入,经过词散列层进行降维,然后经过多层神经网络的非线性变换,得到语义层表示向量;计算两个概念节点的语义层表示向量的余弦相似度作为他们的相关度;基于相似度与预设阈值的比较完成实体消歧。9.一种电力设备知识图谱本体构建系统,其特征在于,包括:原始数据获取模块,用于获取电力设备数据;其中,所述电力设备数据包括电力设备的检修台账数据、检修导则和技术标准;本体框架构建模块,用于基于所述电力设备数据,构建获得电力设备的输电本体框架、变电本体框架和配电本体框架;本体融合模块,用于将构建获得的所述输电本体框架、所述变电本体框架和所述配...

【专利技术属性】
技术研发人员:徐会芳仝杰谈元鹏徐建南张弛
申请(专利权)人:国网天津市电力公司电力科学研究院国网天津市电力公司国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1