一种基于多源数据融合的电网监控领域知识图谱构建方法技术

技术编号:29227962 阅读:14 留言:0更新日期:2021-07-10 01:15
本发明专利技术公开了一种基于多源数据融合的电网监控领域知识图谱构建方法,包括如下步骤:(1)基于电网拓扑结构,构建基础的设备知识图谱;(2)基于电网监控业务的需求,确定需要补充的实体类别和数据的来源;(3)获取所需数据后,确定这些数据是作为图谱的节点、边还是属性值;(4)确定好各数据在图谱中的所属类别后,将数据存储到Neo4j图数据库中,形成的多源数据融合设备知识图谱。本发明专利技术在以往设备知识图谱的基础上融入了多源的数据,提高了图谱的覆盖率和应用范围。率和应用范围。率和应用范围。

【技术实现步骤摘要】
一种基于多源数据融合的电网监控领域知识图谱构建方法


[0001]本专利技术涉及电网监控领域和人工智能领域,尤其是一种基于多源数据融合的电网监控领域知识图谱构建方法。

技术介绍

[0002]目前智能电网调度控制系统已实现了集中监控、综合智能告警等功能,为电网故障判断处置和设备监控运行提供了技术支撑。但面对日益增长的的电网运行监控信息,现有技术手段主要以标准化推理规则库为依据,不能穷尽和覆盖相关情况,并且监控数据存储在不同的数据库中,多源数据无法相互关联,于是电网监控领域引入了知识图谱来存储关联海量的数据。
[0003]知识图谱作为一种基于人工智能技术的知识组织与构建方法,将知识以三元组的形式进行表示,并存储在图数据库中。图数据库由“节点”和“边”组成,充分利用节点之间能够相互指向的特点将不同的信息联系起来,对于处理类似于电网拓扑结构这类网状数据模型具有天然的优势。
[0004]目前,知识图谱在电网监控领域的研究可以分为三个方面:设备知识图谱,案例图谱和业务逻辑图谱。其中设备图谱主要包含电网中不同设备的连接关系。案例图谱是对每次故障的记录。业务逻辑图谱是将监控系统以往的规则和经验进行整理和存储。但是现有的监控领域设备知识图谱大多依据电网拓扑结构,仅仅将厂站中的设备关联在一起,没有充分利用知识图谱扩展性强、关联性广的特点。因此如何使用知识图谱代替以往的多个数据库,在实现基本设备关联的基础上有效地融入更多的信息,进一步实现电力系统智能调度、智能监控,是构建电网监控领域知识图谱中亟待解决的问题。
[0005]国内外专家学者已对领域图谱的构建方法展开大量研究工作,大多数研究针对的是图谱构建中的某个环节或者特定领域的图谱构建方法,尚未对多源数据融合的电网监控领域设备知识图谱展开深入的探讨研究。

技术实现思路

[0006]本专利技术所要解决的技术问题在于,提供一种基于多源数据融合的电网监控领域知识图谱构建方法,能够将电网监控领域中多源的数据融合到知识图谱中,提高图谱的覆盖率和应用范围,满足监控领域“电网一张图”的需求。
[0007]为解决上述技术问题,本专利技术一种基于多源数据融合的电网监控领域知识图谱构建方法,包括如下步骤:
[0008](1)基于电网拓扑结构,构建基础的设备知识图谱
[0009](2)基于电网监控业务的需求,确定需要补充的实体类别和数据的来源;
[0010](3)获取所需数据后,确定这些数据是作为图谱的节点、边还是属性值;
[0011](4)确定好各数据在图谱中的所属类别后,将数据存储到Neo4j图数据库中,形成的多源数据融合设备知识图谱。
[0012]优选的,步骤(1)具体为:
[0013](11)根据业务需求,参照电网拓扑结构模型,设计设备图谱的连接结构;
[0014](12)将结构中所需要的数据按照图谱所需的三元组形式进行整理;
[0015](13)调用图数据库接口导入三元组,形成基础设备知识图谱。
[0016]优选的,步骤(2)具体为:
[0017](21)针对电网监控领域所需信息,确定所需的数据分布在设备台账、变电站情况表和处置手册中,其中设备台账和变电站情况表中的数据是半结构化的表格数据,而处置手册中的数据是非结构化的文本数据;
[0018](22)对于表格数据,通过搜索抓取对应的行或列获得需要的数据;非结构化的文本数据由于数据量较小(只有102个典型监控信息)且数据结构复杂,若通过人工标注再进行计算机抽取,会耗费大量人力且无法保证提取的准确率,因此,采用人工归纳的方法。
[0019]优选的,步骤(3)具体为:
[0020](31)在设备台账中,设备电压等级、间隔类型、设备投运日期是设备的内在特征,所以可以作为旧图谱中设备节点的属性值;设备生产厂家是新的概念即新实体,所以需要创建新的节点;而设备生产时间是设备生产厂家和设备之间的关系,所以作为这两类节点的边;
[0021](32)在变电站情况表中,变电站类型和变电站投运日期是变电站的内在特征,所以可作为旧图谱中变电站节点的属性值;保电场所、配网调控、运维驻地和检修单位是新概念即新实体,所以需要创建新节点;而检修时间是检修单位和变电站之间的关系,所以作为这两类节点的边;
[0022](33)在处置手册中,信号触发原因和故障处理方法都是保护信号的内在特征,所以可以作为旧图谱中保护信号的属性值。
[0023]优选的,步骤(4)具体为:
[0024](41)对于属性类而言,首先构建{实体:属性}的词典,例如{设备:设备电压等级};然后在图数据库中匹配到对应的实体,例如XX设备;最后将属性值添加到对应的节点中;
[0025](42)对于节点类而言,直接在图数据库中创建新的节点;
[0026](43)对于边类而言,首先构建{头实体,关系,尾实体}这样的三元组集合,例如{设备,生产时间,生产厂家};然后在图数据库中匹配到头实体和尾实体;最后将关系作为边连接的两类节点。
[0027]本专利技术的有益效果为:(1)本专利技术提出的多源数据融合知识图谱方法不仅考虑了电网拓扑结构相关的设备关联数据,还将其它与监控领域相关的数据如:设备台账、事件处置情况等整合在一起;(2)本专利技术提出的多源数据融合知识图谱方法相对于通用的设备知识图谱该模型不仅提高了图谱的覆盖率还拓宽了图谱的应用场景。
附图说明
[0028]图1为本专利技术的方法流程示意图。
[0029]图2为本专利技术电网监控领域基础设备知识图谱结构示意图。
[0030]图3为本专利技术多源数据来源和处理方法示意图。
[0031]图4为本专利技术判断数据类型的流程示意图。
[0032]图5为本专利技术构建图谱不同类的流程示意图。
[0033]图6为本专利技术基于多源数据融合的设备知识图谱示意图。
具体实施方式
[0034]如图1所示,一种基于多源数据融合的电网监控领域知识图谱构建方法,包括如下步骤:
[0035](1)基于电网拓扑结构,构建基础的设备知识图谱;
[0036](2)基于电网监控业务的需求,确定需要补充的实体类别和数据的来源;
[0037](3)获取所需数据后,确定这些数据是作为图谱的节点、边还是属性值;
[0038](4)确定好各数据在图谱中的所属类别后,将数据存储到Neo4j图数据库中,形成的多源数据融合设备知识图谱。
[0039]下面对本专利技术技术方案进行详细说明:
[0040]步骤1:基于电网拓扑结构,构建基础的设备知识图谱,主要实施步骤如下所述:
[0041](1)根据业务需求,参照电网拓扑结构模型,设计设备图谱的连接结构
[0042](2)将结构中所需要的数据按照图谱所需的三元组形式进行整理;
[0043](3)调用图数据库接口导入三元组,形成基础设备知识图谱,基础设备知识图谱的结构如图2所示。
[0044]步骤2:基于电网本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多源数据融合的电网监控领域知识图谱构建方法,其特征在于,包括如下步骤:(1)基于电网拓扑结构,构建基础的设备知识图谱;(2)基于电网监控业务的需求,确定需要补充的实体类别和数据的来源;(3)获取所需数据后,确定这些数据是作为图谱的节点、边还是属性值;(4)确定好各数据在图谱中的所属类别后,将数据存储到Neo4j图数据库中,形成多源数据融合设备知识图谱。2.如权利要求1所述的基于多源数据融合的电网监控领域知识图谱构建方法,其特征在于,步骤(1)具体为:(11)根据业务需求,参照电网拓扑结构模型,设计设备图谱的连接结构;(12)将结构中所需要的数据按照图谱所需的三元组形式进行整理;(13)调用图数据库接口导入三元组,形成基础设备知识图谱。3.如权利要求1所述的基于多源数据融合的电网监控领域知识图谱构建方法,其特征在于,步骤(2)具体为:(21)针对电网监控领域所需信息,确定所需的数据分布在设备台账、变电站情况表和处置手册中,其中设备台账和变电站情况表中的数据是半结构化的表格数据,而处置手册中的数据是非结构化的文本数据;(22)对于表格数据,通过搜索抓取对应的行或...

【专利技术属性】
技术研发人员:刘翌杨垠彬潘小辉赵扬张明黄秋根胡秦然
申请(专利权)人:国网江苏省电力有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1