【技术实现步骤摘要】
一种基于XML间接映射的RDF构建方法
本专利技术公开了一种一种基于XML间接映射的RDF构建方法。该方法通过映射文档对XML文档中的相关元素进行查询定位来构建RDF,关键在于设计一种适合于编写该映射文档的映射语言——X2RML。
技术介绍
XML作为一种灵活的半结构化标签语言,在信息表示和数据交换方面有先天的优势。XML现在被广泛的应用于各种团体和商界,在很多应用领域,人们已经定义了基于XML的应用,比如数学领域(MathML)、天文领域(AML)、生物信息领域(BSML)、投资领域(IRML)等等。此外,可以作为统一数据交换格式的XML在企业信息交换方面也发挥了巨大的作用。XML已经成为Web数据表示与交换的事实上的标准。语义Web是基于图和“链接”的组织方式,但是所链接的不再是网页而是客观世界中的实体,实体之间的链接也被增加了语义描述。RDF是语义Web中用于组织语义化数据的数据模型,RDFSchema通过定义RDF使用的词汇为其赋予语义。知识图谱作为语义Web发展的产物成为了研究的热点,虽然并不是所有知识图谱的描述框架是RDF,但本质都是描述实体、实体的属性及关系,知识图谱中将三元组称作为知识。RDF通过聚合大量的知识实现快速响应和推理,已经被广泛地应用到智能领域作为数据组织的方式。Web中存在大量不同结构形态且没有语义信息的数据,基于这些数据构建RDF或知识图谱已经成为了一个重要的研究方向。XML是Web中统一的数据存储和交换格式,因其结构灵活、可移植性强,以XML描述的数据广泛存在于Web中,已经 ...
【技术保护点】
1.一种基于XML间接映射的RDF构建方法,其主要特征包括如下步骤:/n(1)X2RML映射文档结构:X2RML映射文档是以RDF图的形式来描述的,即RDF不仅仅是映射XML数据的目标数据模型也是用于描述X2RML映射文档所选用的数据模型,X2RML映射文档也被称作映射图,映射图可以拥有若干个子映射图,每个子映射图都对应一个三元组映射,三元组映射又包含逻辑树组件、主语映射组件以及谓语-宾语映射组件,各个映射组件实现不同的映射功能;/n(2)定义逻辑树组件中的逻辑树:逻辑树组件中的逻辑树通过查询定位的方式从输入的XML文档中获取所需的元素节点集,逻辑树定位XML元素的方式是通过一个有效的XQuery查询,这个XQuery查询的结果是所输入的XML文档中的部分元素,可以将这些查询所得的元素形式化为XML文档的树形模型中对应的子树模型;/n(3)定义主语映射组件和谓语-宾语映射组件:逻辑树确定了子映射图所要映射的源数据,然后使用三元组映射中的主语映射组件和谓语-宾语映射组件将逻辑树确定的若干元素映射为若干条RDF三元组序列,每个元素对应一组与之相关的RDF三元组序列。/n
【技术特征摘要】
1.一种基于XML间接映射的RDF构建方法,其主要特征包括如下步骤:
(1)X2RML映射文档结构:X2RML映射文档是以RDF图的形式来描述的,即RDF不仅仅是映射XML数据的目标数据模型也是用于描述X2RML映射文档所选用的数据模型,X2RML映射文档也被称作映射图,映射图可以拥有若干个子映射图,每个子映射图都对应一个三元组映射,三元组映射又包含逻辑树组件、主语映射组件以及谓语-宾语映射组件,各个映射组件实现不同的映射功能;
(2)定义逻辑树组件中的逻辑树:逻辑树组件中的逻辑树通过查询定位的方式从输入的XML文档中获取所需的元素节点集,逻辑树定位XML元素的方式是通过一个有效的XQuery查询,这个XQuery查询的结果是所输入的XML文档中的部分元素,可以将这些查询所得的元素形式化为XML文档的树形模型中对应的子树模型;
(3)定义主语映射组件和谓语-宾语映射组件:逻辑树确定了子映射图所要映射的源数据,然后使用三元组映射中的主语映射组件和谓语-宾语映射组件将逻辑树确定的若干元素映射为若干条RDF三元组序列,每个元素对应一组与之相关的RDF三元组序列。
2.根据权利1要求所述的三元组映射,其特征在于,所述步骤(1)中提出的三元组映射包括三个部分:
(2-1)逻辑树组件:逻辑树组件中的逻辑树确定了子映射图所要映射的源数据,然后使用三元组映射中的主语映射组件和谓语-宾语映射组件将逻辑树确定的若干元素映射为若干条RDF三元组序列,每个元素对应一组与之相关的RDF三元组序列;
(2-2)主语映射组件:该组件中的主语映射将逻辑树中定位的每个元素映射为所生成的与该元素相关的RDF三元组序列中的主语部分;
(2-3)谓语-宾语映射组件:包括谓语映射组件和宾语映射组件,映射结果即相关RDF三元组的属性和值。
3.根据权利1要求所述的逻辑树组件,其特征在于,所述步骤(2)中提出的逻辑树组件规定如下:
(3-1)逻辑树组件确定了它所属的三元组映射所要处理的XML元素集,描述该组件的RDF陈述所用的属性为xr:logicalTree,该属性...
【专利技术属性】
技术研发人员:刘玉春,马宗民,
申请(专利权)人:南京航空航天大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。