一种面向RDF三元组的数据自定义映射方法技术

技术编号:22330095 阅读:36 留言:0更新日期:2019-10-19 12:16
一种面向RDF三元组的数据自定义映射方法,包括如下步骤:步骤一、获取关系数据库数据;步骤二、利用Direct Mapping映射语言将数据库表结构和数据直接输出为RDF图;利用R2RML映射语言定制具体的数据库结构和词表,并将数据关系库输出为RDF数据集;步骤三、以Direct Mapping映射语言作为默认映射方案,以R2RML作为个性化定制方案。本发明专利技术中Direct Mapping映射语言提供机器自动转换的初始规则,R2RML提供人工自定义的逻辑框架和语法规则,两种映射方式互为补充,以更好的将关系数据库中的数据转换为RDF的三元组数据。

A method of data Custom mapping for RDF triples

【技术实现步骤摘要】
一种面向RDF三元组的数据自定义映射方法
本专利技术涉及数据处理
,尤其涉及一种面向RDF三元组的数据自定义映射方法。
技术介绍
资源描述框架(ResourceDescriptionFramework)是一种用于描述Web资源的标记语言。RDF是一个处理元数据的XML(标准通用标记语言的子集)应用,所谓元数据,就是“描述数据的数据”或者“描述信息的信息”。在将含有结构化历史数据的关系数据库融入到知识图谱中时,直接使用关系数据库显然是不合适的,关系数据库并不能满足应用于知识图谱时的需求,需将关系数据库中的数据根据映射关系转换为RDF三元组数据,以更好的描述和应用数据。而且,采用单一映射方式将关系数据库中的数据转换为RDF三元组数据具有一定的局限性,不能根据用户需求进行个性化定制。
技术实现思路
(一)专利技术目的为解决
技术介绍
中存在的技术问题,本专利技术提出一种面向RDF三元组的数据自定义映射方法,DirectMapping映射语言提供机器自动转换的初始规则,R2RML提供人工自定义的逻辑框架和语法规则,两种映射方式互为补充,以更好的将关系数据库中的数据转换为RDF的三元组数据。(二)技术方案为解决上述问题,本专利技术提供了一种面向RDF三元组的数据自定义映射方法,包括如下步骤:步骤一、获取关系数据库数据;步骤二、利用DirectMapping映射语言将数据库表结构和数据直接输出为RDF图;利用R2RML映射语言定制具体的数据库结构和词表,并将数据关系库输出为RDF数据集;步骤三、以DirectMapping映射语言作为默认映射方案,以R2RML作为个性化定制方案。优选的,以“输入数据库”作为R2RML处理器工作的原材料;以R2RML映射文件作为R2RML处理器工作的依据;R2RML处理器依据R2RML映射文件将“输出数据库”输出为可访问可获取的“输出数据集”。优选的,在R2RML的“输出数据集”中,R2RML包括两种对空节点的处理方式,具体如下:第一种:当同一空节点标识符出现于同一RDF图中的多个三元组中时,该多个三元组共用同一空节点;第二种:当同一空节点标识符出现于多个RDF图中时,该空节点不能被不同的RDF图共用。优选的,利用R2RML处理器根据DirectMapping的映射方式自动生成R2RML映射文件,再遵循R2RML语法自定义R2RML映射文件。优选的,在利用“三元组映射”将“逻辑表”映射为RDF的框架中,利用“主体映射”定义主体,利用“谓词客体映射”定义谓词和客体。优选的,利用包括有DirectMapping映射语言和R2RML映射语言的RDB2RDF映射语言在RDF-RDB2RDF、XSPARQL、Ultrawrap和db2triples中的任意一种工作平台上将数据库数据输出为RDF数据集。本专利技术的上述技术方案具有如下有益的技术效果:为将含有结构化历史数据的关系数据库融入到知识图谱中,采用资源描述框架(RDF)作为数据模型,将关系数据库的数据转换为RDF的三元组数据。具体转换过程中,利用DirectMapping映射语言进行直接的映射,采用该种映射方式输出的RDF图中,用于表示类和谓词的术语与关系数据库中的表名和字段名保持一致;利用R2RML映射语言进行个性化定制的映射,采用该种映射方式输出的RDF数据集中,用到的术语如类的名称、谓词均来自于已有的词汇表;DirectMapping映射语言提供机器自动转换的初始规则,R2RML提供人工自定义的逻辑框架和语法规则,两种映射方式互为补充,以更好的将关系数据库中的数据转换为RDF的三元组数据。附图说明图1为本专利技术提出的一种面向RDF三元组的数据自定义映射方法的结构流程图。图2为本专利技术提出的一种面向RDF三元组的数据自定义映射方法中R2RML的工作机制结构示意图。图3为本专利技术提出的一种面向RDF三元组的数据自定义映射方法中将“逻辑表”映射为RDF的实现框架结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本专利技术进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本专利技术的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本专利技术的概念。如图1-3所示,本专利技术提出的一种面向RDF三元组的数据自定义映射方法,包括如下步骤:步骤一、获取关系数据库数据;步骤二、利用DirectMapping映射语言将数据库表结构和数据直接输出为RDF图;利用R2RML映射语言定制具体的数据库结构和词表,并将数据关系库输出为RDF数据集;步骤三、以DirectMapping映射语言作为默认映射方案,以R2RML作为个性化定制方案。本专利技术中,为将含有结构化历史数据的关系数据库融入到知识图谱中,采用资源描述框架(RDF)作为数据模型,将关系数据库的数据转换为RDF的三元组数据。具体转换过程中,利用DirectMapping映射语言进行直接的映射,采用该种映射方式输出的RDF图中,用于表示类和谓词的术语与关系数据库中的表名和字段名保持一致;利用R2RML映射语言进行个性化定制的映射,采用该种映射方式输出的RDF数据集中,用到的术语如类的名称、谓词均来自于已有的词汇表;DirectMapping映射语言提供机器自动转换的初始规则,R2RML提供人工自定义的逻辑框架和语法规则,两种映射方式互为补充,以更好的将关系数据库中的数据转换为RDF的三元组数据。在一个可选的实施例中,以“输入数据库”作为R2RML处理器工作的原材料;以R2RML映射文件作为R2RML处理器工作的依据;R2RML处理器依据R2RML映射文件将“输出数据库”输出为可访问可获取的“输出数据集”。需要说明的是,R2RML工作机制包含“输入数据库”、R2RML映射文件和R2RML处理器共三个要素,三个要素为R2RML将关系数据库中的数据转换为RDF的三元组数据提供必要支持。在一个可选的实施例中,在R2RML的“输出数据集”中,R2RML包括两种对空节点的处理方式,具体如下:第一种:当同一空节点标识符出现于同一RDF图中的多个三元组中时,该多个三元组共用同一空节点;第二种:当同一空节点标识符出现于多个RDF图中时,该空节点不能被不同的RDF图共用。需要说明的是,根据两种具体情况,以采用不同的针对空节点的处理方式。在一个可选的实施例中,利用R2RML处理器根据DirectMapping的映射方式自动生成R2RML映射文件,再遵循R2RML语法自定义R2RML映射文件。在一个可选的实施例中,在利用“三元组映射”将“逻辑表”映射为RDF的框架中,利用“主体映射”定义主体,利用“谓词客体映射”定义谓词和客体。需要说明的是,在将“逻辑表”映射为RDF三元组时,该RDF三元组共享同一个由“主体映射”定义的主体。在一个可选的实施例中,利用包括有DirectMapping映射语言和R2RML映射语言的RDB2RDF映射语言在RDF-RDB2RDF、XSPARQL、Ultrawrap和db2triples中的任意一种工作平台上将数据库数据输出为RDF数据集。需要说明的是,上述工作平台均可实施DirectMapping和R2RML标准规范,而且,实现方式包括本文档来自技高网...

【技术保护点】
1.一种面向RDF三元组的数据自定义映射方法,其特征在于,包括如下步骤:步骤一、获取关系数据库数据;步骤二、利用Direct Mapping映射语言将数据库表结构和数据直接输出为RDF图;利用R2RML映射语言定制具体的数据库结构和词表,并将数据关系库输出为RDF数据集;步骤三、以Direct Mapping映射语言作为默认映射方案,以R2RML作为个性化定制方案。

【技术特征摘要】
1.一种面向RDF三元组的数据自定义映射方法,其特征在于,包括如下步骤:步骤一、获取关系数据库数据;步骤二、利用DirectMapping映射语言将数据库表结构和数据直接输出为RDF图;利用R2RML映射语言定制具体的数据库结构和词表,并将数据关系库输出为RDF数据集;步骤三、以DirectMapping映射语言作为默认映射方案,以R2RML作为个性化定制方案。2.根据权利要求1所述的一种面向RDF三元组的数据自定义映射方法,其特征在于,以“输入数据库”作为R2RML处理器工作的原材料;以R2RML映射文件作为R2RML处理器工作的依据;R2RML处理器依据R2RML映射文件将“输出数据库”输出为可访问可获取的“输出数据集”。3.根据权利要求2所述的一种面向RDF三元组的数据自定义映射方法,其特征在于,在R2RML的“输出数据集”中,R2RML包括两种对空节点的处理方式,具体如下:第一种:当同一空节点标识符出现于同一RDF图中...

【专利技术属性】
技术研发人员:刘家祥
申请(专利权)人:厦门美域中央信息科技有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1