电力标准知识图谱构建方法、装置、计算机设备和介质制造方法及图纸

技术编号:27059278 阅读:14 留言:0更新日期:2021-01-15 14:39
本申请涉及一种电力标准知识图谱构建方法、装置、计算机设备和存储介质,其中方法包括:分析与整理电力标准数据,以自顶向下设计电力标准知识图谱的模式层,基于规则以及机器学习算法对所述电力标准数据进行知识抽取,得到抽取后的数据,对抽取后的数据进行实体链接,构建电力标准知识图谱。上述方案中采用基于规则与机器学习技术的电力标准数据进行知识抽取,并进行知识融合和实体链接构建得到的合理且准确的电力标准知识图谱,可以支持电力标准数据高效且准确搜索。

【技术实现步骤摘要】
电力标准知识图谱构建方法、装置、计算机设备和介质
本申请涉及智能电网
,特别是涉及一种电力标准知识图谱构建方法、装置、计算机设备和存储介质。
技术介绍
当前是通过建设电力标准管理系统,实现电力标准管理信息化。通过标准信息数据的统一管理,提供标准信息的查询和分析等功能,主要目的是实现互联互通和信息共享。当前标准文献服务系统还停留在基于关键字的文献检索层次,标准文献的加工力度较粗,未能深入到标准文献内部的语义知识单元,忽视了标准文献知识单元之间的关联管理,只能提供简单的文献搜索和下载功能,不能为用户提供面向深层次的标准文献服务。在实际应用中,由于存在标准文献的版权问题导致了标准文献机器可读取全文数据获取困难,很多标准文献以PDF图像扫描件的形式储存,导致计算机难以读取标准文献内容信息。因此,多数系统通过光符识别技术对标准文献进行转化处理,获取相应纯文本数据。然而,纯文本数据在解决内容读取问题的同时,也导致了原始文本的结构丢失,不利于标准文献的语义加工及语义知识组织。另外,由于标准文献覆盖不同专业、行业、涉及众多科学知识内容,本体内容比较复杂,难以构建一个通用的知识本体,且人工构建的方式需要消耗大量的人力成本。上述原因导致了目前电力标准数据搜索过程复杂且搜索结果不准确。
技术实现思路
基于此,有必要针对上述技术问题,提供一种支持电力标准数据高效且准确搜索的电力标准知识图谱构建方法、装置、计算机设备和存储介质。一种电力标准知识图谱构建方法,方法包括:获取电力标准数据;对电力标准数据进行分析与整理,以自顶向下设计电力标准知识图谱的模式层;根据电力标准知识图谱的模式层,基于规则以及机器学习算法对电力标准数据进行知识抽取,得到抽取后的数据;对抽取后的数据进行实体链接,构建电力标准知识图谱。在其中一个实施例中,根据电力标准知识图谱的模式层,基于规则以及机器学习算法对电力标准数据进行知识抽取,得到抽取后的数据包括:对电力标准数据进行预处理,得到预处理后的数据;根据电力标准知识图谱的模式层,基于规则以及机器学习算法对电力标准数据进行实体抽取以及实体关系抽取;根据实体抽取以及实体关系抽取的结果,得到知识图谱三元组数据;将知识图谱三元组数据与电力标准知识图谱的模式层进行匹配,删除知识图谱三元组数据中错误的三元组数据、并补齐数据缺失的三元组数据,得到抽取后的数据。在其中一个实施例中,根据电力标准知识图谱的模式层,基于规则以及机器学习算法对电力标准数据进行实体抽取以及实体关系抽取包括:基于电力标准知识图谱的模式层、并采用深度学习模型LSTM-CRF对预处理后的数据进行实体抽取,得到实体抽取结果;基于电力标准知识图谱的模式层、并采用序列和树结构的LSTM的关系抽取算法进行关系抽取,得到实体关系抽取结果。在其中一个实施例中,对电力标准数据进行预处理,得到预处理后的数据包括:根据电力标准知识图谱的模式层对电力标准数据依次进行去除脏数据处理,脏数据包括冗余数据、重复数据、错误数据以及异常数据的任意一种。在其中一个实施例中,对电力标准数据进行分析与整理,以自顶向下设计电力标准知识图谱的模式层包括:对电力标准数据进行处理,分析归纳数据模式;基于预设电力标准经验数据对处理后的数据进行抽象建模,采用自顶向下设计电力标准知识图谱的模式层。在其中一个实施例中,对抽取后的数据进行实体链接,构建电力标准知识图谱包括:对抽取后的数据采用构建名称词典的方式生产候选实体;采用基于学习排名的算法对候选实体进行排序,得到排序结果;根据排序结果进行实体链接,构建电力标准知识图谱。在其中一个实施例中,对抽取后的数据进行实体链接,构建电力标准知识图谱之后,还包括:当接收到搜索请求时,提取搜索请求中携带的搜索内容;对搜索内容进行实体提取并识别用户意图数据;将实体提取结果以及用户意图数据转换为SPARQL查询语句;根据SPARQL查询语句,调用SPARQL查询函数从电力标准知识图谱查询数据,得到查询结果。一种电力标准知识图谱构建装置,装置包括:标准数据获取模块,用于获取电力标准数据;模式层设计模块,用于对电力标准数据进行分析与整理,以自顶向下设计电力标准知识图谱的模式层;知识抽取模块,用于根据电力标准知识图谱的模式层,基于规则以及机器学习算法对电力标准数据进行知识抽取,得到抽取后的数据;知识图谱构建模块,用于对抽取后的数据进行实体链接,构建电力标准知识图谱。一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现如上述方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述的方法的步骤。上述电力标准知识图谱构建方法、装置、计算机设备和存储介质,分析与整理电力标准数据,以自顶向下设计电力标准知识图谱的模式层,基于规则以及机器学习算法对电力标准数据进行知识抽取,得到抽取后的数据,对抽取后的数据进行实体链接,构建电力标准知识图谱。上述方案中采用基于规则与机器学习技术的电力标准数据进行知识抽取,并进行知识融合和实体链接构建得到的合理且准确的电力标准知识图谱,可以支持电力标准数据高效且准确搜索。附图说明图1为一个实施例中电力标准知识图谱构建方法的应用环境图;图2为一个实施例中电力标准知识图谱构建方法的流程示意图;图3为另一个实施例中电力标准知识图谱构建方法的流程示意图;图4为一个实施例中电力标准知识图谱构建装置的结构框图;图5为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的电力标准知识图谱构建方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。知识图谱构建阶段,终端102将电力标准数据采集上传至服务器104,服务器104获取终端102上传的电力标准数据以及自行爬取等方式自动归集得到的电力标准数据,服务器104对电力标准数据进行分析与整理,以自顶向下设计电力标准知识图谱的模式层;根据电力标准知识图谱的模式层,基于规则以及机器学习算法对电力标准数据进行知识抽取,得到抽取后的数据;对抽取后的数据进行实体链接,构建电力标准知识图谱,服务器104将构建的电力标准知识图谱保存下来。当在电力标准数据查询阶段时,用户通过其他用户终端发送查询请求到服务器104,服务器104基于存储的电力标准知识图谱查询并反馈查询结果。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服本文档来自技高网...

【技术保护点】
1.一种电力标准知识图谱构建方法,所述方法包括:/n获取电力标准数据;/n对所述电力标准数据进行分析与整理,以自顶向下设计电力标准知识图谱的模式层;/n根据所述电力标准知识图谱的模式层,基于规则以及机器学习算法对所述电力标准数据进行知识抽取,得到抽取后的数据;/n对抽取后的数据进行实体链接,构建电力标准知识图谱。/n

【技术特征摘要】
1.一种电力标准知识图谱构建方法,所述方法包括:
获取电力标准数据;
对所述电力标准数据进行分析与整理,以自顶向下设计电力标准知识图谱的模式层;
根据所述电力标准知识图谱的模式层,基于规则以及机器学习算法对所述电力标准数据进行知识抽取,得到抽取后的数据;
对抽取后的数据进行实体链接,构建电力标准知识图谱。


2.根据权利要求1所述的方法,其特征在于,所述根据所述电力标准知识图谱的模式层,基于规则以及机器学习算法对所述电力标准数据进行知识抽取,得到抽取后的数据包括:
对所述电力标准数据进行预处理,得到预处理后的数据;
根据所述电力标准知识图谱的模式层,基于规则以及机器学习算法对所述电力标准数据进行实体抽取以及实体关系抽取;
根据实体抽取以及实体关系抽取的结果,得到知识图谱三元组数据;
将所述知识图谱三元组数据与所述电力标准知识图谱的模式层进行匹配,删除所述知识图谱三元组数据中错误的三元组数据、并补齐数据缺失的三元组数据,得到抽取后的数据。


3.根据权利要求2所述的方法,其特征在于,所述根据所述电力标准知识图谱的模式层,基于规则以及机器学习算法对所述电力标准数据进行实体抽取以及实体关系抽取包括:
基于所述电力标准知识图谱的模式层、并采用深度学习模型LSTM-CRF对所述预处理后的数据进行实体抽取,得到实体抽取结果;
基于所述电力标准知识图谱的模式层、并采用序列和树结构的LSTM的关系抽取算法进行关系抽取,得到实体关系抽取结果。


4.根据权利要求2所述的方法,其特征在于,所述对所述电力标准数据进行预处理,得到预处理后的数据包括:
根据所述电力标准知识图谱的模式层对所述电力标准数据依次进行去除脏数据处理,所述脏数据包括冗余数据、重复数据、错误数据以及异常数据的任意一种。


5.根据权利要求1所述的方法,其特征在于,所述对所述电力标准数据进行分析与整理,...

【专利技术属性】
技术研发人员:陈浩敏张凡姚森敬于力辛文成席禹敖榜姜臻张斌郭志诚李晋伟周敬中
申请(专利权)人:南方电网数字电网研究院有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1