一种基于多规则的知识图谱动态生成方法技术

技术编号:21034475 阅读:19 留言:0更新日期:2019-05-04 05:29
本发明专利技术公开一种基于多规则的知识图谱动态生成方法,包括以下步骤:加载原始数据;将原始数据的格式解析并转化生成为datarow格式;获取相应的本体文件;将每个本体文件的数据内容按照相应的处理规则通过RDF三元组生成方法生成RDF文件;将生成的RDF文件进行解析存储,在存储过程中,形成知识图谱。在知识图谱生成的过程中可根据不同的数据源或本体文件加载相应一个或者是多个处理规则,在一次处理流程中可以动态的根据多种规则生成知识图谱。提高多源异构数据统一处理的能力。

【技术实现步骤摘要】
一种基于多规则的知识图谱动态生成方法
本专利技术涉及知识图谱生成方法
,具体来说,涉及一种基于多规则的知识图谱动态生成方法。
技术介绍
知识图谱随着近几年的发展有了广泛的应用,例如在金融领域利用知识图谱进行风险控制,在搜索领域利用知识图谱进行对搜索结果进行推荐等,在知识图谱构建领域主要是基于本体构建数据中实体以及实体之间的关系,进而来构建知识图谱网络。主要包括本体的构建和实体三元组的关系建立等。其中:本体的构建主要是基于OWL语言来进行构建,OWL是一种通用的处理Web信息的内容的方法,由计算机应用程序来读取。主要是通过定义类以及类的属性来形式化某个领域;并通过定义个体并说明它们之间的属性;OWL语言支持对类和个体进行推理。实体三元组主要是构建基于RDF的三元组数据,RDF是(ResourceDescriptionFramework)资源描述框架是一种用于描述Web资源的标记语言,一种描述信息的通用方法,这样就可以被计算机应用程序读取并理解,用来在网络上显示的主要用来描述知识图谱中实体以及实体之间关系的一种标记型语言。上述方法是知识图谱构建过程中的基础方法,目前针对知识图谱的构建主要还是在封闭的空间内设计单独的规则通过本体来构建实体以及关系。无法对异构数据进行统一的知识抽取。无法高效的利用多种规则动态的生成知识图谱。针对相关技术中的问题,目前尚未提出有效的解决方案。
技术实现思路
针对相关技术中的上述技术问题,本专利技术提出一种基于多规则的知识图谱动态生成方法,可针对多源的结构化数据通过统一的流程,利用多种知识图谱生成的规则动态的对数据进行知识抽取和知识图谱的构建。可以提高知识图谱的构建效率和提高数据的利用率。为实现上述技术目的,本专利技术的技术方案是这样实现的:一种基于多规则的知识图谱动态生成方法,包括以下步骤:S1加载原始数据,所述原始数据包括数据源ID以及若干本体文件;S2将所述原始数据的格式解析并转化生成为datarow格式,转化后的所述原始数据中,其本体文件的数据内容通过键值对的形式与本体ID相对应,所述数据内容包括若干实体以及每个所述实体所对应的属性;S3根据所述数据源ID及规则映射表获取若干所述本体ID,再根据所述本体ID获取相应的所述本体文件;S4将每个所述本体文件的数据内容按照相应的处理规则通过RDF三元组生成方法生成RDF文件,从而得到每个所述本体文件中若干所述实体之间的关系;S5将生成的所述RDF文件进行解析存储,在存储过程中,按照所述关系对不同所述本体文件中的所述实体进行关联,从而形成知识图谱。进一步地,所述RDF三元组生成方法包括以下步骤:S01利用jena工具解析所述本体文件,获取所述本体文件中的所述实体和所述属性并根据所述属性得到若干所述实体之间的关系;S02利用jena工具将得到的所述实体、所述属性和所述关系抽取成具有继承关系的Class;S03将所述实体按照其属性的类别加载到相应的Class中完成实例化;S04通过实例化的Class生成RDF协议的三元组。进一步地,所述规则映射表为数据源和OWL本体对应关系表。进一步地,在S5中,对所述实体进行关联时,将所述实体按照所述属性进行匹配,将同一所述属性的相同所述实体进行合并。本专利技术的有益效果:在知识图谱生成的过程中可根据不同的数据源或本体文件加载相应一个或者是多个处理规则,在一次处理流程中可以动态的根据多种规则生成知识图谱。提高多源异构数据统一处理的能力。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据本专利技术实施例所述的基于多规则的知识图谱动态生成方法的示意图;图2是根据本专利技术实施例所述的RDF三元组生成方法的示意图;图3是根据本专利技术实施例所述的知识图谱生成系统的示意图。图中:1、电缆防水接头;2、密封筒;3、电缆;4、绝缘内芯;5、密封胶;6、连接法兰;7、环形沟槽。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,根据本专利技术实施例所述的一种基于多规则的知识图谱动态生成方法,包括以下步骤:S1加载原始数据,所述原始数据包括数据源ID以及若干本体文件;S2将所述原始数据的格式解析并转化生成为datarow格式,转化后的所述原始数据中,其本体文件的数据内容通过键值对的形式与本体ID相对应,所述数据内容包括若干实体以及每个所述实体所对应的属性;S3根据所述数据源ID及规则映射表获取若干所述本体ID,再根据所述本体ID获取相应的所述本体文件;S4将每个所述本体文件的数据内容按照相应的处理规则通过RDF三元组生成方法生成RDF文件,从而得到每个所述本体文件中若干所述实体之间的关系;S5将生成的所述RDF文件进行解析存储,在存储过程中,按照所述关系对不同所述本体文件中的所述实体进行关联,从而形成知识图谱。在本专利技术的一个具体实施例中,所述RDF三元组生成方法包括以下步骤:S01利用jena工具解析所述本体文件,获取所述本体文件中的所述实体和所述属性并根据所述属性得到若干所述实体之间的关系;S02利用jena工具将得到的所述实体、所述属性和所述关系抽取成具有继承关系的Class;S03将所述实体按照其属性的类别加载到相应的Class中完成实例化;S04通过实例化的Class生成RDF协议的三元组。在本专利技术的一个具体实施例中,所述规则映射表为数据源和OWL本体对应关系表。在本专利技术的一个具体实施例中,在S5中,对所述实体进行关联时,将所述实体按照所述属性进行匹配,将同一所述属性的相同所述实体进行合并。在本专利技术的一个具体实施例中,所述RDF三元组生成方法包括以下步骤:S01利用jena工具解析所述本体文件,获取所述本体文件中的所述实体和所述属性并根据所述属性得到若干所述实体之间的关系;S02利用jena工具将得到的所述实体、所述属性和所述关系抽取成具有继承关系的Class;S03将所述实体按照其属性的类别加载到相应的Class中完成实例化。S04通过实例化的Class生成RDF协议的三元组。在本专利技术的一个具体实施例中,所述规则映射表为数据源和OWL本体对应关系表。在本专利技术的一个具体实施例中,在S5中根据所述关系将关联后的所述实体按照所述属性进行匹配,将同一所述属性的相同所述实体进行合并。为了方便理解本专利技术的上述技术方案,以下通过具体使用方式对本专利技术的上述技术方案进行详细说明。如图3所示,本专利技术还公开了一种知识图谱生成系统,该系统主要用于本体文件的管理,可根据业务需求构建OWL本体文件(即OWL格式的本体文件)并对本体文件进行管理,包括:本体(即本体文件)导入,本体的新增、查询、修改、删除和本体推理三个模块。本体导入模块支持已经构建完成的OWL本体的导入操作,并进行基于文件的存储,生成本体文件的全局ID。本体CRUD模块可以在系本文档来自技高网...

【技术保护点】
1.一种基于多规则的知识图谱动态生成方法,其特征在于,包括以下步骤:S1加载原始数据,所述原始数据包括数据源ID以及若干本体文件;S2将所述原始数据的格式解析并转化生成为datarow格式,转化后的所述原始数据中,其本体文件的数据内容通过键值对的形式与本体ID相对应,所述数据内容包括若干实体以及每个所述实体所对应的属性;S3根据所述数据源ID及规则映射表获取若干所述本体ID,再根据所述本体ID获取相应的所述本体文件;S4将每个所述本体文件的数据内容按照相应的处理规则通过RDF三元组生成方法生成RDF文件,从而得到每个所述本体文件中若干所述实体之间的关系;S5将生成的所述RDF文件进行解析存储,在存储过程中,按照所述关系对不同所述本体文件中的所述实体进行关联,从而形成知识图谱。

【技术特征摘要】
1.一种基于多规则的知识图谱动态生成方法,其特征在于,包括以下步骤:S1加载原始数据,所述原始数据包括数据源ID以及若干本体文件;S2将所述原始数据的格式解析并转化生成为datarow格式,转化后的所述原始数据中,其本体文件的数据内容通过键值对的形式与本体ID相对应,所述数据内容包括若干实体以及每个所述实体所对应的属性;S3根据所述数据源ID及规则映射表获取若干所述本体ID,再根据所述本体ID获取相应的所述本体文件;S4将每个所述本体文件的数据内容按照相应的处理规则通过RDF三元组生成方法生成RDF文件,从而得到每个所述本体文件中若干所述实体之间的关系;S5将生成的所述RDF文件进行解析存储,在存储过程中,按照所述关系对不同所述本体文件中的所述实体进行关联,从而形成知识图谱。2.根据权利要求1所...

【专利技术属性】
技术研发人员:徐汕梁炬黄文锋张晶亮单酉杨端卫未
申请(专利权)人:北京航天云路有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1