一种电力物资知识图谱构建方法技术

技术编号:36451322 阅读:13 留言:0更新日期:2023-01-25 22:47
本发明专利技术公开了一种电力物资知识图谱构建方法,其包括采集电力系统数据,包括获取电力系统内部现有数据、获取缺失的产品和服务信息数据和外部网络信息资源;划分数据类别,将电力系统数据根据数据属性分类;若数据为结构化数据或由第三方数据库导入,则进行数据整合后知识融合,若数据为半结构化数据和非结构化数据,则进行知识抽取,将抽取过后的数据进行知识融合;基于融合后的数据构建知识库;本发明专利技术可更新公用电力物资百科知识库,结合电力物资细分标准,基于工智能算法模型,形成电力物资百科知识库查询目录框架。进一步分析公共电力物资百科知识网络实现通过物资分类、关键词等方式方便进行查询需求以及公共应用内容展示需求。需求。

【技术实现步骤摘要】
一种电力物资知识图谱构建方法


[0001]本专利技术涉及知识图谱构建
,特别是一种电力物资知识图谱构建方法。

技术介绍

[0002]20世纪中叶,普莱斯等人提出使用引文网络来研究当代科学发展的脉络的方法,首次提出了知识图谱的概念。1977年,知识工程的概念在第五届国际人工智能大会上被提出,以专家系统为代表的知识库系统开始被广泛研究和应用,直到20世纪90年代,机构知识库的概念被提出,自此关于知识表示、知识组织的研究工作开始深入开展起来。机构知识库系统被广泛应用于各科研机构和单位内部的资料整合以及对外宣传工作。2012年11月Google公司率先提出知识图谱的概念,表示将在其搜索结果中加入知识图谱的功能。其初衷是为了提高搜索引擎的能力,增强用户的搜索质量以及搜索体验。据2015年1月统计的数据,Google构建的KG已经拥有5亿个实体,约35亿条实体关系信息,已经被广泛应用于提高搜索引擎的搜索质量。虽然知识图谱的概念较新,但它并非是一个全新的研究领域,早在2006年,BernersLee就提出了数据链接的思想,呼吁推广和完善相关的技术标准如URI,RDF,OWL,为迎接语义网络的到来做好准备。随后掀起了一场语义网络研究的热潮,知识图谱技术正是建立在相关的研究成果之上的,是对现有语义网络技术的一次扬弃和升华。
[0003]随着城市化与工业化脚步的不断加快,对电力的需求越来越大,电力物资的供给保障是决定电力建设的关键,现阶段电力物资信息的管理和应用多靠人工方式进行,远不足以满足电力个部门对电力物资信息的应用需求,未来根据电力物资行业应用需求建立电力物资百科知识网络是解决当前问题的重要手段和发展趋势,同时,也是为未来建设电力物资智慧大脑等高级应用奠定坚实的基础。

技术实现思路

[0004]本部分的目的在于概述本专利技术的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分、说明书摘要和专利技术名称的目的模糊,而这种简化或省略不能用于限制本专利技术的范围。
[0005]鉴于现有技术中存在的问题,提出了本专利技术。
[0006]因此,本专利技术所要解决的技术问题是电力系统物资管理系统管理复杂,其操作不便,随着对电力的需求越来越大电力物资的供给难以得到保障。
[0007]为解决上述技术问题,本专利技术提供如下技术方案:一种电力物资知识图谱构建方法,其包括采集电力系统数据,包括获取电力系统内部现有数据、获取缺失的产品和服务信息数据和外部网络信息资源;
[0008]划分数据类别,将电力系统数据根据数据属性分类;
[0009]若数据为结构化数据或由第三方数据库导入,则进行数据整合后知识融合,若数据为半结构化数据和非结构化数据,则进行知识抽取,将抽取过后的数据进行知识融合;
[0010]基于融合后的数据构建知识库。
[0011]作为本专利技术所述电力物资知识图谱构建方法的一种优选方案,其中:所述知识抽取包括实体抽取、关系抽取和属性抽取,所述实体抽取和关系抽取包括基于规则和词典的方法以及基于统计机器学习的方法,所述属性抽取包括基于规则与启发式算法以及基于机器学习的算法。
[0012]作为本专利技术所述电力物资知识图谱构建方法的一种优选方案,其中:检测到所述数据为第三方数据库导入,采用知识合并的方式进行数据整合,并与本地结构化数据进行知识融合。
[0013]作为本专利技术所述电力物资知识图谱构建方法的一种优选方案,其中:所述知识合并包括数据层的融合和通过模式层的融合;
[0014]数据层的融合:包括实体的指称、属性、关系以及所属类别;
[0015]通过模式层的融合:将新得到的本体融入已有的本体库中。
[0016]作为本专利技术所述电力物资知识图谱构建方法的一种优选方案,其中:所述知识融合包括实体对齐、本体构建和重量评估,半结构化数据和非结构化数据通过知识抽取后进行实体对齐;
[0017]结构化数据和第三方数据库导入的数据通过数据整合后进行实体对齐;
[0018]通过实体对齐的数据进行本体构建,然后对其进行质量评估。
[0019]作为本专利技术所述电力物资知识图谱构建方法的一种优选方案,其中:实体对齐主要用于消除异构数据中实体冲突、指向不明的问题,其从顶层创建统一知识库,辅助机器理解多源异质的数据,形成高质量的知识库。
[0020]作为本专利技术所述电力物资知识图谱构建方法的一种优选方案,其中:所述实体对齐采用对齐算法处理数据,所述对齐算法分为成对实体对齐和集体实体对齐;
[0021]成对实体对齐包括基于传统概率模型的实体对齐方法和基于机器学习的实体对齐方法;
[0022]集体实体对齐包括局部集体实体对齐和全局集体实体对齐。
[0023]作为本专利技术所述电力物资知识图谱构建方法的一种优选方案,其中:所述局部实体对齐方法为实体本身的属性以及有关联的实体的属性分别设置不同的权重,并通过加权求和计算总体的相似度,使用向量空间模型以及余弦相似性来判别大规模知识库中的实体的相似程度,为每个实体建立名称向量与虚拟文档向量;
[0024]所述所述知识抽取选用VIPS算法,使用Dividable函数进行数据节点的分割;
[0025]所述数据节点信息包括节点中文本的颜色,节点在页面大小,节点的HTML 标签信息,节点和孩子、兄弟节点信息。
[0026]所述全局集体实体对齐方法包括基于相似性传播的集体实体对齐方法和基于概率模型的集体实体对齐方法。
[0027]作为本专利技术所述电力物资知识图谱构建方法的一种优选方案,其中:获取当前节点所有孩子节点页面分块特征;
[0028]识别当前节点HTML标签应用规则库;
[0029]判断当前节点分割情况;
[0030]当判断为当前节点可分时,寻找所有当前节点孩子节点继续分割;
[0031]当判断为当前节点不可分时,判断是否存在兄弟节点分割情况,如果存在兄弟节
点可分,继续分割兄弟节点回归最初阶段,如果兄弟节点仍然不可分割,则结果流程输出不可分割集合作为分块结果。
[0032]作为本专利技术所述电力物资知识图谱构建方法的一种优选方案,其中:所述知识融合还包括知识推理和知识更新,所述知识推理基于实体对齐和本体构建从知识库中的实体关系数据出发,建立实体间的新关联,所述知识更新基于质量评估对数据进行更新;
[0033]所述知识推理包括基于逻辑的推理、基于图的推理和跨知识库的知识推理;
[0034]所述知识更新包括数据驱动下的全面更新和增量更新。
[0035]本专利技术的有益效果:本专利技术通过基于电力物资知识图谱的构建,可更新公用电力物资百科知识库,结合电力物资细分标准,基于工智能算法模型,形成电力物资百科知识库查询目录框架。进一步分析公共电力物资百科知识网络实现通过物资分类、关键词等方式方便进行查询需求以及公共应用内容展示需求。
附图说明
[0036]为了更清楚地说明本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种电力物资知识图谱构建方法,其特征在于:包括,采集电力系统数据,包括获取电力系统内部现有数据、获取缺失的产品和服务信息数据和外部网络信息资源;划分数据类别,将电力系统数据根据数据属性分类;若数据为结构化数据或由第三方数据库导入,则进行数据整合后知识融合,若数据为半结构化数据和非结构化数据,则进行知识抽取,将抽取过后的数据进行知识融合;基于融合后的数据构建知识库。2.如权利要求1所述的电力物资知识图谱构建方法,其特征在于:所述知识抽取包括实体抽取、关系抽取和属性抽取,所述实体抽取和关系抽取包括基于规则和词典的方法以及基于统计机器学习的方法,所述属性抽取包括基于规则与启发式算法以及基于机器学习的算法。3.如权利要求2所述的电力物资知识图谱构建方法,其特征在于:检测到所述数据为第三方数据库导入,采用知识合并的方式进行数据整合,并与本地结构化数据进行知识融合。4.如权利要求3所述的电力物资知识图谱构建方法,其特征在于:所述知识合并包括数据层的融合和通过模式层的融合;数据层的融合:包括实体的指称、属性、关系以及所属类别;通过模式层的融合:将新得到的本体融入已有的本体库中。5.如权利要求1~3任一所述的电力物资知识图谱构建方法,其特征在于:所述知识融合包括实体对齐、本体构建和重量评估,半结构化数据和非结构化数据通过知识抽取后进行实体对齐;结构化数据和第三方数据库导入的数据通过数据整合后进行实体对齐;通过实体对齐的数据进行本体构建,然后对其进行质量评估。6.如权利要求5所述的电力物资知识图谱构建方法,其特征在于:实体对齐主要用于消除异构数据中实体冲突、指向不明的问题,其从顶层创建统一知识库,辅助机器理解多源异质的数据,形成高质量的知识库。7.如权利要求6...

【专利技术属性】
技术研发人员:杨洁郑佳妮田行健岳凡与邓楚杭
申请(专利权)人:贵州电网物资有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1