知识图谱的构建方法及构建装置、电子设备制造方法及图纸

技术编号:32114884 阅读:14 留言:0更新日期:2022-01-29 18:59
本发明专利技术公开了一种知识图谱的构建方法及构建装置、电子设备。其中,该构建方法包括:获取电力业扩报装词库;基于电力业扩报装词库对业扩报装文件进行分词,得到分词结果;采用命名实体识别模型对业扩报装文件进行命名实体识别,得到命名实体识别结果;基于分词结果和命名实体识别结果,抽取业扩报装文件中的本体与实体之间的关系和属性,得到三元组数据;基于抽取出的三元组数据和业扩报装文件,构建业扩报装知识图谱。本发明专利技术解决了相关技术中通过人工经验给出电力业扩报装的供电方案,存在编制速度慢,效率低的技术问题。效率低的技术问题。效率低的技术问题。

【技术实现步骤摘要】
知识图谱的构建方法及构建装置、电子设备


[0001]本专利技术涉及信息处理
,具体而言,涉及一种知识图谱的构建方法及构建装置、电子设备。

技术介绍

[0002]相关技术中,随着云平台和物联网技术的快速发展,在电力行业的业扩报装工作呈现出智能化、大数据化的特征。但是,由于当前的业扩报装业务较为复杂,涉及面广,需要大量专家现场经验,人工通过现场经验给出的电力业扩报装方案,存在供电方案编制速度慢,效率低,如何有效加快供电方案编制速度,提高优质服务水平和客户满意度,提高市场影响力与占有率呈现出前所未有的紧迫感。因此需要整合业扩报装过程中各个环节资源信息,打造专有知识库,建立知识图谱体系将原本孤立存在于各个业务系统中的业务数据、流程、数据表等依照电力业务对象的业务架构关联在一起,向使用者提供全面、条理化的信息查询服务,以客户实际感知量身打造客户贴身服务成为当前业扩工作的必由之路。
[0003]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本专利技术实施例提供了一种知识图谱的构建方法及构建装置、电子设备,以至少解决相关技术中通过人工经验给出电力业扩报装的供电方案,存在编制速度慢,效率低的技术问题。
[0005]根据本专利技术实施例的一个方面,提供了一种知识图谱的构建方法,包括:获取电力业扩报装词库;基于所述电力业扩报装词库对业扩报装文件进行分词,得到分词结果;采用命名实体识别模型对所述业扩报装文件进行命名实体识别,得到命名实体识别结果;基于所述分词结果和所述命名实体识别结果,抽取所述业扩报装文件中的本体与实体之间的关系和属性,得到三元组数据;基于抽取出的三元组数据和所述业扩报装文件,构建业扩报装知识图谱。
[0006]可选地,在获取电力业扩报装词库之前,所述构建方法还包括:采用预设光学字符识别插件,对电力业扩报装的历史业务文件进行文字识别,得到文字识别结果;对所述文字识别结果进行分词处理,得到业扩报装基础词典;采用所述业扩报装基础词典,确定所述业扩报装知识图谱的实体与本体之间的关联关系。
[0007]可选地,抽取所述业扩报装文件中的本体与实体之间的关系和属性,得到三元组数据的步骤,包括:采用双向长短时记忆网络Bi

LSTM,抽取所述业扩报装文件中的本体与实体之间的关系和属性,得到三元组数据。
[0008]可选地,基于抽取出的三元组数据和所述业扩报装文件,构建业扩报装知识图谱的步骤,包括:基于抽取出的三元组数据和所述业扩报装文件,对所述业扩报装文件进行知识融合处理,得到融合结果;基于所述融合结果,对业扩报装数据的可信度进行量化处理,得到每个业扩报装数据的数据可信度;将数据可信度低于预设可信度阈值的业扩报装数据
删除;对删除后的业扩报装数据对应的本体和实体关系按照图关联关系存储,得到所述业扩报装知识图谱。
[0009]可选地,基于抽取出的三元组数据和所述业扩报装文件,对所述业扩报装文件进行知识融合处理,得到融合结果的步骤,包括:基于抽取出的三元组数据和所述业扩报装文件,根据预先设置的实体指称项,通过相似度计算将指称项链接到正确的实体对象;根据实体的指称、属性、关系以及所属类别,进行数据层融合处理;在完成数据层融合处理后,进行模式层融合处理,得到的业扩报装本体库;将所述业扩报装本体库融入已有的本体库中,得到融合结果。
[0010]可选地,在基于抽取出的三元组数据和所述业扩报装文件,构建业扩报装知识图谱之后,所述构建方法还包括:采用预设图形数据库存储构建完成的所述业扩报装知识图谱。
[0011]根据本专利技术实施例的另一方面,还提供了一种知识图谱的构建装置,包括:获取单元,用于获取电力业扩报装词库;分词单元,用于基于所述电力业扩报装词库对业扩报装文件进行分词,得到分词结果;实体识别单元,用于采用命名实体识别模型对所述业扩报装文件进行命名实体识别,得到命名实体识别结果;抽取单元,用于基于所述分词结果和所述命名实体识别结果,抽取所述业扩报装文件中的本体与实体之间的关系和属性,得到三元组数据;构建单元,用于基于抽取出的三元组数据和所述业扩报装文件,构建业扩报装知识图谱。
[0012]可选地,所述知识图谱的构建装置还包括:文字识别模块,用于在获取电力业扩报装词库之前,采用预设光学字符识别插件,对电力业扩报装的历史业务文件进行文字识别,得到文字识别结果;分词处理模块,用于对所述文字识别结果进行分词处理,得到业扩报装基础词典;确定模块,用于采用所述业扩报装基础词典,确定所述业扩报装知识图谱的实体与本体之间的关联关系。
[0013]可选地,所述抽取单元包括:抽取模块,用于采用双向长短时记忆网络Bi

LSTM,抽取所述业扩报装文件中的本体与实体之间的关系和属性,得到三元组数据。
[0014]可选地,所述构建单元包括:融合处理模块,用于基于抽取出的三元组数据和所述业扩报装文件,对所述业扩报装文件进行知识融合处理,得到融合结果;量化处理模块,用于基于所述融合结果,对业扩报装数据的可信度进行量化处理,得到每个业扩报装数据的数据可信度;删除模块,用于将数据可信度低于预设可信度阈值的业扩报装数据删除;关系存储模块,用于对删除后的业扩报装数据对应的本体和实体关系按照图关联关系存储,得到所述业扩报装知识图谱。
[0015]可选地,所述融合处理模块包括:计算子模块,用于基于抽取出的三元组数据和所述业扩报装文件,根据预先设置的实体指称项,通过相似度计算将指称项链接到正确的实体对象;融合处理子模块,用于根据实体的指称、属性、关系以及所属类别,进行数据层融合处理;模式层融合处理子模块,用于在完成数据层融合处理后,进行模式层融合处理,得到的业扩报装本体库;本体库融合处理子模块,用于将所述业扩报装本体库融入已有的本体库中,得到融合结果。
[0016]可选地,所述知识图谱的构建装置还包括:存储模块,用于在基于抽取出的三元组数据和所述业扩报装文件,构建业扩报装知识图谱之后,采用预设图形数据库存储构建完
成的所述业扩报装知识图谱。
[0017]根据本专利技术实施例的另一方面,还提供了一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的知识图谱的构建方法。
[0018]根据本专利技术实施例的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任意一项所述的知识图谱的构建方法。
[0019]本专利技术实施例中,采用获取电力业扩报装词库,基于电力业扩报装词库对业扩报装文件进行分词,得到分词结果,采用命名实体识别模型对业扩报装文件进行命名实体识别,得到命名实体识别结果,基于分词结果和命名实体识别结果,抽取业扩报装文件中的本体与实体之间的关系和属性,得到三元组数据,基于抽取出的三元组数据和业扩报装文件,构建业扩报装知识图谱。在该实施例中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识图谱的构建方法,其特征在于,包括:获取电力业扩报装词库;基于所述电力业扩报装词库对业扩报装文件进行分词,得到分词结果;采用命名实体识别模型对所述业扩报装文件进行命名实体识别,得到命名实体识别结果;基于所述分词结果和所述命名实体识别结果,抽取所述业扩报装文件中的本体与实体之间的关系和属性,得到三元组数据;基于抽取出的三元组数据和所述业扩报装文件,构建业扩报装知识图谱。2.根据权利要求1所述的构建方法,其特征在于,在获取电力业扩报装词库之前,所述构建方法还包括:采用预设光学字符识别插件,对电力业扩报装的历史业务文件进行文字识别,得到文字识别结果;对所述文字识别结果进行分词处理,得到业扩报装基础词典;采用所述业扩报装基础词典,确定所述业扩报装知识图谱的实体与本体之间的关联关系。3.根据权利要求1所述的构建方法,其特征在于,抽取所述业扩报装文件中的本体与实体之间的关系和属性,得到三元组数据的步骤,包括:采用双向长短时记忆网络Bi

LSTM,抽取所述业扩报装文件中的本体与实体之间的关系和属性,得到三元组数据。4.根据权利要求1所述的构建方法,其特征在于,基于抽取出的三元组数据和所述业扩报装文件,构建业扩报装知识图谱的步骤,包括:基于抽取出的三元组数据和所述业扩报装文件,对所述业扩报装文件进行知识融合处理,得到融合结果;基于所述融合结果,对业扩报装数据的可信度进行量化处理,得到每个业扩报装数据的数据可信度;将数据可信度低于预设可信度阈值的业扩报装数据删除;对删除后的业扩报装数据对应的本体和实体关系按照图关联关系存储,得到所述业扩报装知识图谱。5.根据权利要求4所述的构建方法,其特征在于,基于抽取出的三元组数据和所述业扩报装文件,对所述业扩报装文件进行知识融合处理,得到融合结果的步骤,包括:基于抽取出的三元组数据和所述业扩报装文件,根据预先设置的实体指称项,通过相似度计算将指称项链...

【专利技术属性】
技术研发人员:张禄陆斯悦邱明泉林华段大鹏王洪彪马龙飞赵宇彤严嘉慧
申请(专利权)人:国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1