知识图谱本体模型构建的方法和装置制造方法及图纸

技术编号:24251598 阅读:39 留言:0更新日期:2020-05-22 23:36
本发明专利技术公开了知识图谱本体模型构建的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取资源数据;识别所述资源数据中符合已构建本体数据模式的结构化数据,根据所述已构建本体数据模式和结构化数据确定第一本体;基于所述资源数据中不符合已构建本体数据模式的异构化数据抽取本体数据模式,根据抽取的本体数据模式和异构化数据确定第二本体;合并第一本体和第二本体,得到知识图谱本体模型。该实施方式能够在提高本体模型构建效率的同时提高模型构建的可扩展性,且构建出的知识图谱本体模型具有系统性和全面性,适用范围广。

Method and device of building ontology model of knowledge map

【技术实现步骤摘要】
知识图谱本体模型构建的方法和装置
本专利技术涉及计算机
,尤其涉及一种知识图谱本体模型构建的方法和装置。
技术介绍
知识图谱(KnowledgeGraph)本质上是语义网络(SemanticNetwork),是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,指的是具有可区别性且独立存在的某种事物。知识图谱在逻辑上通常可分为数据层和模式层,本体模型即是模式层的表达,而数据层则存储真实的数据。知识图谱目前主要有自顶向下(top-down)与自底向上(bottom-up)两种构建方法。自顶向下指的是先为知识图谱定义好本体数据模式,再将实体加入到知识库。自底向上指的是从一些开放链接数据中提取出实体,选择其中置信度较高的加入到知识库,再构建顶层的本体模式。目前构建知识图谱时,基本都是基于具体的业务场景直接构建,即这类项目的实施跳过了本体建模过程,直接进行了知识图谱模型的构建。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:自顶向下的构建方法扩展性差,自底向上的构建方法数据提取工作量大,效率低;基于具体业务场景构建的知识图谱无法提供较为系统、全面的本体模型,适用范围小。
技术实现思路
有鉴于此,本专利技术实施例提供一种知识图谱本体模型构建的方法和装置,能够在提高本体模型构建效率的同时提高模型构建的可扩展性,且构建出的知识图谱本体模型具有系统性和全面性,适用范围广。根据本专利技术实施例的一个方面,提供了一种知识图谱本体模型构建的方法,包括:获取资源数据;识别所述资源数据中符合已构建本体数据模式的结构化数据,根据所述已构建本体数据模式和结构化数据确定第一本体;基于所述资源数据中不符合已构建本体数据模式的异构化数据抽取本体数据模式,根据抽取的本体数据模式和异构化数据确定第二本体;合并第一本体和第二本体,得到知识图谱本体模型。可选地,第一本体和第二本体包括:实体、属性和关联关系;所述关联关系的获取方式包括以下至少之一:直接获取、加工获取、推理获取。可选地,确定第一本体和/或第二本体之后,还包括:对第一本体和/或第二本体中的本体进行质量评估,基于评估结果修正第一本体和/或第二本体。可选地,所述知识图谱本体模型采用文档或者Protégé软件记录。根据本专利技术实施例的第二方面,提供一种知识图谱本体模型构建的装置,包括:提取模块,获取资源数据;第一确定模块,识别所述资源数据中符合已构建本体数据模式的结构化数据,根据所述已构建本体数据模式和结构化数据确定第一本体;第二确定模块,基于所述资源数据中不符合已构建本体数据模式的异构化数据抽取本体数据模式,根据抽取的本体数据模式和异构化数据确定第二本体;合并模块,合并第一本体和第二本体,得到知识图谱本体模型。可选地,第一本体和第二本体包括:实体、属性和关联关系;所述关联关系的获取方式包括以下至少之一:直接获取、加工获取、推理获取。可选地,本专利技术实施例的装置还包括:评价模块,用于在第一确定模块确定第一本体和/或第二确定模块确定第二本体之后,对第一本体和/或第二本体中的本体进行质量评估,基于评估结果修正第一本体和/或第二本体。可选地,所述合并模块采用文档或者Protégé软件记录所述知识图谱本体模型。根据本专利技术实施例的第三方面,提供一种知识图谱本体模型构建的电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术实施例第一方面提供的方法。根据本专利技术实施例的第四方面,提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本专利技术实施例第一方面提供的方法。上述专利技术中的一个实施例具有如下优点或有益效果:本专利技术中,对于符合已构建本体数据模式的结构化数据,根据已构建本体数据模式和结构化数据确定第一本体;对于不符合已构建本体数据模式的异构化数据,从异构化数据中抽取本体数据模式然后根据抽取的本体数据模式和异构化数据确定第二本体,能够在提高本体模型构建效率的同时提高模型构建的可扩展性,且构建出的知识图谱本体模型具有系统性和全面性,适用范围广。上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。附图说明附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:图1是本专利技术知识图谱本体模型构建的方法的主要流程的示意图;图2是本专利技术实施例的知识图谱本体模型构建的体系架构示意图;图3是本专利技术实施例的知识图谱本体模型构建的原理示意图;图4是本专利技术一些实施例中知识图谱本体模型的记录方式示意图;图5是本专利技术再一些实施例中知识图谱本体模型的记录方式示意图;图6是本专利技术还一些实施例中知识图谱本体模型的记录方式示意图;图7是本专利技术可选实施例中一级本体的示意图;图8是本专利技术可选实施例中一级本体、二级本体和三级本体的示意图;图9是本专利技术可选实施例中关联关系的示意图;图10是本专利技术一些实施例中知识图谱本体模型的示意图;图11是本专利技术再一些实施例中知识图谱本体模型的示意图;图12是基于本专利技术的知识图谱本体模型构建的物理模型的示意图;图13是本专利技术知识图谱本体模型构建的装置的主要模块的示意图;图14是本专利技术实施例可以应用于其中的示例性系统架构图;图15是适于用来实现本专利技术实施例的终端设备或服务器的计算机系统的结构示意图。具体实施方式以下结合附图对本专利技术的示范性实施例做出说明,其中包括本专利技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本专利技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。知识图谱(KnowledgeGraph)本质上是语义网络(SemanticNetwork),是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,指的是具有可区别性且独立存在的某种事物。如某一个企业、某一个城市、某一种植物等、某一种商品等等。世界万物由具体事物组成,此指实体。实体是知识图谱中的最基本元素,实体有属性,不同的实体间存在不同的关系,每条边为实体与实体之间的“关系”,实体和关系又有其自身的“属性”。实体、关系和属性构成知识图谱的核心三要素,知识图谱是每组“实体<--关系-->实体”的集合,是把所有不同种类的信息连接在一起而得到的一个关系网络,它提供了从“关系”的角度去分析问题的能力。知识图谱在逻辑上,通常可分为数据层和模式层,本体模型即是模式层的表达,可以理解为面向对象里的“类”的概念,而数据层则存储真实的数据。例如:本文档来自技高网...

【技术保护点】
1.一种知识图谱本体模型构建的方法,其特征在于,包括:/n获取资源数据;/n识别所述资源数据中符合已构建本体数据模式的结构化数据,根据所述已构建本体数据模式和结构化数据确定第一本体;/n基于所述资源数据中不符合已构建本体数据模式的异构化数据抽取本体数据模式,根据抽取的本体数据模式和异构化数据确定第二本体;/n合并第一本体和第二本体,得到知识图谱本体模型。/n

【技术特征摘要】
1.一种知识图谱本体模型构建的方法,其特征在于,包括:
获取资源数据;
识别所述资源数据中符合已构建本体数据模式的结构化数据,根据所述已构建本体数据模式和结构化数据确定第一本体;
基于所述资源数据中不符合已构建本体数据模式的异构化数据抽取本体数据模式,根据抽取的本体数据模式和异构化数据确定第二本体;
合并第一本体和第二本体,得到知识图谱本体模型。


2.如权利要求1所述的方法,其特征在于,第一本体和第二本体包括:实体、属性和关联关系;所述关联关系的获取方式包括以下至少之一:直接获取、加工获取、推理获取。


3.如权利要求1所述的方法,其特征在于,确定第一本体和/或第二本体之后,还包括:对第一本体和/或第二本体中的本体进行质量评估,基于评估结果修正第一本体和/或第二本体。


4.如权利要求1所述的方法,其特征在于,所述知识图谱本体模型采用文档或者Protégé软件记录。


5.一种知识图谱本体模型构建的装置,其特征在于,包括:
提取模块,获取资源数据;
第一确定模块,识别所述资源数据中符合已构建本体数据模式的结构化数据,根据所述已构建本体数据模式和结构化数据确定第一本体;
第二确定模块,基于所述资...

【专利技术属性】
技术研发人员:刘冰冰陈青山李晓敦万光明赵世辉邓杨高宏华崔莹琰章晖郑宇瀚
申请(专利权)人:中国建设银行股份有限公司建信金融科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1