一种融合推理机的知识图谱构建方法技术

技术编号:31755043 阅读:30 留言:0更新日期:2022-01-05 16:37
本发明专利技术涉及一种融合推理机的知识图谱构建方法,属于知识图谱领域。本发明专利技术根据业务实际情况手动构建知识图谱schema,利用推理机加速实体属性和关系的定义,导入半结构化数据进行知识抽取,对知识图谱数据清洗和归一消歧,然后融入规则设计对知识进行深度推理加工,形成最终的规则知识库。本发明专利技术基于知识图谱的结构数据对海量信息进行整合与管理,再结合规则推理,可提升知识推理的效果,得到更为准确的推理结果和可视化展示。本发明专利技术知识图谱可融合多源异构数据,增强数据的组织和关联性,方便存储管理海量数据;在知识图谱的构建过程中引入推理机进行规则设计,有效对知识进行深度推理和知识整合,加速知识图谱的构建过程,提高数据准确性。数据准确性。数据准确性。

【技术实现步骤摘要】
一种融合推理机的知识图谱构建方法


[0001]本专利技术属于知识图谱领域,具体涉及一种融合推理机的知识图谱构建方法。

技术介绍

[0002]在大数据时代,企业或领域拥有海量级数据,并且存在结构化、半结构化、非结构化等不同类型的异构数据,由于数据类型之间的差异、数据库存储能力等方面的限制,需要存储在不同的数据库和文件系统中,因此各种数据的关联融合性较差,数据提取与分析存在困难,不能很好地进行知识表示。知识图谱技术的应运而生,可构建实体与关系的大规模语义网络,支撑知识的智能化表示、推理、检索和服务,成为了解决传统计算技术的一个重要途径。
[0003]知识图谱作为人工智能
之一,以符号形式描述物理世界中的实体及其相互关系,具有强大的数据结构化组织和语义处理能力,让知识可被搜索,可被问答,可被支持决策行动,为智能化信息应用提供了基础。
[0004]推理机可作为组件嵌入到应用程序中,可根据事实输入从复杂交错的情况中快速准确地找到合适的决策资源,推理得出决策结果。但推理机一般都是基于传统的关系型数据库,对于非结构化和半结构化数据的关联整合、知识提取和分析挖掘等操作几乎无能为力,且推理机在数据结果可视化展示上不够清晰直观。
[0005]为解决上述技术问题,本文提出了一种融合推理机的知识图谱构建方法,用以加速知识图谱的构建过程,提高数据的准确性,提升知识可视化效果。

技术实现思路

[0006](一)要解决的技术问题
[0007]本专利技术要解决的技术问题是如何提供一种融合推理机的知识图谱构建方法,以解决推理机对于非结构化和半结构化数据的关联整合、知识提取和分析挖掘等操作几乎无能为力,且推理机在数据结果可视化展示上不够清晰直观的问题。
[0008](二)技术方案
[0009]为了解决上述技术问题,本专利技术提出一种融合推理机的知识图谱构建方法,该方法包括如下步骤:
[0010]S1、由行业专家参与设计构建知识图谱Schema;
[0011]S2、利用推理机Pellet加速上述Schema的构建;
[0012]S3、导入结构化数据源;从关系型数据库中将结构化数据映射到S1中创建的知识图谱中;
[0013]S4、将S1创建的知识图谱与S3映射好的知识图谱进行知识合并操作,形成一张知识图谱;若需要导入半结构化数据丰富上述构建的知识图谱,则进行步骤S5,否则转至步骤S7;
[0014]S5、导入半结构化数据源。则从Excel或数据库导入半结构化数据源,进行知识抽
取,具体包括实体抽取、关系抽取和属性抽取;
[0015]S6、对融入了异构数据的知识图谱进行数据清洗和实体消歧操作;
[0016]S7、对知识图谱进行知识加工,具体包括知识推理和质量评估,最终形成规则知识库。
[0017]进一步地,所述步骤S1具体包括:根据专业的领域知识自上而下抽象出领域内的概念层次结构,借助本体编辑软件Prot
é
g
é
手动定义OWL本体和属性,描述清楚各实体之间的关系和实体包含的属性;属性分为Object属性和Datatype属性。
[0018]进一步地,本体是概念的集合,即对象编程里的类,在类中可创建子类,将本体进行细分。
[0019]进一步地,所述步骤S2具体包括:在Prot
é
g
é
中的菜单中选择Pellet推理机,Pellet推理机会给出推理的层级结构,并标红不稳定的类,自动推理类的层级结构。
[0020]进一步地,所述步骤S3中的关系型数据库为MySQL关系型数据库。
[0021]进一步地,所述步骤S3的映射操作包括实体映射、属性映射和关系映射,实体映射将知识图谱中定义的实体与关系型数据库中的数据表进行逐个关联;属性映射将实体的属性与其关联的数据表中的字段进行映射;关系映射是建立实体与实体之间存在的关联关系。
[0022]进一步地,所述步骤S5具体包括:利用实体识别技术从半结构化数据中抽取出原子信息元素,从中找到命名实体并进行分类;利用LTP工具包进行关系抽取,确定实体之间的关系;定位文本中的属性信息,建立模板文件,对数据进行属性抽取。
[0023]进一步地,所述步骤S6具体包括:配置正则表达式统一数据格式和语法格式,确认等价实例、等价类和等价属性,避免导入的数据与创建的数据存在实体或关系冲突,提高数据质量。
[0024]进一步地,所述步骤S7具体包括如下步骤:
[0025]S71.根据规则意图设计规则表达式;
[0026]S72.构建规则表达式、表达式函数与常规运算符之间的关系以完成规则表达式配置;
[0027]S73.利用Pellet推理机依据规则表达式对本体的概念层次关系、属性值进行深度关联推理,挖掘实体间的隐含关联关系;
[0028]S74.行业专家对知识推理后的知识图谱进行质量评估,检查知识图谱中潜在的一些错误,对出现的错误加以修正,最终形成融合规则的规则知识库。
[0029]进一步地,所述步骤S71具体包括:选定实体,依据该实体具有的基础属性和关系属性,按照逻辑顺序依次设计规则表达式。
[0030](三)有益效果
[0031]本专利技术提出一种融合推理机的知识图谱构建方法,根据业务实际情况手动构建知识图谱schema,利用推理机加速实体属性和关系的定义,导入半结构化数据进行知识抽取,对知识图谱数据清洗和归一消歧,然后融入规则设计对知识进行深度推理加工,形成最终的规则知识库。本专利技术基于知识图谱的结构数据可以更好的对海量信息进行整合与管理,再结合规则推理,可提升知识推理的效果,得到更为准确的推理结果和可视化展示。本专利技术知识图谱可融合多源异构数据,增强数据的组织和关联性,方便存储管理海量数据;在知识
图谱的构建过程中引入推理机进行规则设计,有效对知识进行深度推理和知识整合,加速知识图谱的构建过程,提高数据准确性。
附图说明
[0032]图1为本专利技术本专利技术的知识图谱构建流程图;
[0033]图2为知识加工流程图。
具体实施方式
[0034]为使本专利技术的目的、内容和优点更加清楚,下面结合附图和实施例,对本专利技术的具体实施方式作进一步详细描述。
[0035]本专利技术的目的在于提供一种融合推理机的知识图谱构建方法,根据业务实际情况手动构建知识图谱schema,利用推理机加速实体属性和关系的定义,导入半结构化数据进行知识抽取,对知识图谱数据清洗和归一消歧,然后融入规则设计对知识进行深度推理加工,形成最终的规则知识库。
[0036]本专利技术具有如下优点:基于知识图谱的结构数据可以更好的对海量信息进行整合与管理,再结合规则推理,可提升知识推理的效果,得到更为准确的推理结果和可视化展示。
[0037]本专利技术提供一种融合推理机的知识图谱构建方法,其步骤包括:
[0038]S1、由行业专家参与设计构建知识图谱Schema本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种融合推理机的知识图谱构建方法,其特征在于,该方法包括如下步骤:S1、由行业专家参与设计构建知识图谱Schema;S2、利用推理机Pellet加速上述Schema的构建;S3、导入结构化数据源;从关系型数据库中将结构化数据映射到S1中创建的知识图谱中;S4、将S1创建的知识图谱与S3映射好的知识图谱进行知识合并操作,形成一张知识图谱;若需要导入半结构化数据丰富上述构建的知识图谱,则进行步骤S5,否则转至步骤S7;S5、导入半结构化数据源。则从Excel或数据库导入半结构化数据源,进行知识抽取,具体包括实体抽取、关系抽取和属性抽取;S6、对融入了异构数据的知识图谱进行数据清洗和实体消歧操作;S7、对知识图谱进行知识加工,具体包括知识推理和质量评估,最终形成规则知识库。2.如权利要求1所述的融合推理机的知识图谱构建方法,其特征在于,所述步骤S1具体包括:根据专业的领域知识自上而下抽象出领域内的概念层次结构,借助本体编辑软件Prot
é
g
é
手动定义OWL本体和属性,描述清楚各实体之间的关系和实体包含的属性;属性分为Object属性和Datatype属性。3.如权利要求2所述的融合推理机的知识图谱构建方法,其特征在于,本体是概念的集合,即对象编程里的类,在类中可创建子类,将本体进行细分。4.如权利要求3所述的融合推理机的知识图谱构建方法,其特征在于,所述步骤S2具体包括:在Prot
é
g
é
中的菜单中选择Pellet推理机,Pellet推理机会给出推理的层级结构,并标红不稳定的类,自动推理类的层级结构。5.如权利要求2所述的融合推理机的知识图谱构建方法,其特征在于,所述步骤S3中...

【专利技术属性】
技术研发人员:陈玉伟
申请(专利权)人:北京计算机技术及应用研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1