当前位置: 首页 > 专利查询>孟小峰专利>正文

一种本体数据(Ontology)管理系统和方法技术方案

技术编号:2827952 阅读:189 留言:0更新日期:2012-04-11 18:40
一种本体数据管理系统包括:数据存储模块,用于对磁盘数据页进行组织和管理且向上层提供以逻辑页为单位的存储管理服务;数据管理模块,用于进行三元组形式的本体数据管理,其包括三元组在数据页内的存储组织、访问、以及更新;数据处理模块,用于负责本体数据的导入、查询、以及更新处理;以及用户界面模块,用于负责用户与系统的交互。

【技术实现步骤摘要】

本专利技术涉及计算机网络
,尤其是涉及一种本体数据 (Ontology)管理方法。
技术介绍
万维网是一个巨大的信息资源库,不仅有门类齐全的文本信息,而 且有丰富多彩的多媒体信息,无论何时何地,人们都可以很方便地获取 自己想要的信息。然而,信息的爆炸使得当今的万维网已经不堪重负, 要想从这个巨大的资源库中找到自己想要的信息更是大海捞针。 一些网 站如yahoo、 google等搜索引擎可以提供一些帮助,但是这些还远远不 够。很多时候,用户不仅仅想查找一个网页,他们还想让计算机做的更 多。例如,用户计划去加勒比海度过一个浪漫的^f叚期,去之前想在Web 上预定一个中等价位的意大利旅馆,并且这个旅馆离 一个著名的电影院 只有五个街区的距离。这些信息可能分别由不同的网站提供,在机器无 法识别信息的情况下,所有的事情都需要用户亲自去做。用户需要分别 去这些网站获取需要的信息,然后再根据自己的需要选择合适的内容。 这种需求是当前流行的搜索引擎无法满足的,于是就出现了很多关于Web 信息集成方面的研究工作,但是这方面的工作一般都针对一个特定的应 用,无法对应不同的数据类型,因此无法直接应用到基于Web信息的复 杂应用上来。为了使来自不同地方的数据源的信息很容易的集成起来,需要由一 个相关领域知识的共同理解。Ontology提供了一个支持共享和重用知识 的公共词汇。Ontology通过描述事物以及事物之间的关系来描述现实世 界的语义。Ontology可以作为知识共享和知识发现的工具 一方面它可以作为 不同系统之间的沟通媒介,另一方面通过已有的Ontology描述可以推知 更多的知识。语义网络是Ontology的一个重要应用场景,它使机器能自动识别并处理网络上的信息,从而提高人们使用和管理网络资源的能力。 万维网已经成了人们获取信息的主要来源,随着网络技术的发展,人们在网络上发布自己的信息成了一件越来越简单的事情,但目前的Web 依赖于用户的技术,只能被人所理解,机器却无法自动识别,Web只负责 提供信息给用户,剩下的事情都需要用户自己去处理,这给用户带了极 大的不便。语义网正是在这种环境下应运而生。语义网(Semantic Web) 是一个由万维网联盟的蒂姆.伯纳斯-李(Tim Berners-Lee)在1998 年提出的一个概念,它的核心是通过给万维网上的文档(如HTML) 添加能够被计算机所理解的元数据(Meta data),从而使整个互联网成 为一个通用的信息交换媒介。语义万维网通过使用标准、置标语言和相 关的处理工具来扩展万维网的能力。万维网上的信息虽然是机器可读的,但却不是机器可理解的,由此 导致网上的信息难以被计算机自动处理。解决这个难题的途径就是采用 元数据来索引网上的信息,然后使用RDF资源描述框架来描述元数据以 及元数据与元数据之间的关系。由W3C提出的RDF[3]和RDFS目前已经成 为描述网络资源语义的标准语言。RDF的全称是资源描述框架,用于表示 元数据。RDF用三元组(Subject, Property, Object)来表示资源以及 资源之间的关系,和以文档或以数据为中心的XML相比,RDF是以知识为 中心的方法,是专门为Web,尤其是语义网设计的,而XML是为信息交换 提供了统一的语法格式。RDF优于XML的一个方面是RDF图描绘了资源的 唯一表示方式,而对同一内容XML却有多种形式。RDF只定义了用于描述 资源的框架,但没有定义使用哪些元数据来表述资源的,但允许定义元 数据来描述特定的资源。这种定义出来的元数据被称为RDF Schema,简 称RDFS。 RDFS ( RDF Schema )可以被用来表示特定领域内的词汇,与XML DTD或者XML Schema相比,RDFS并没有对数据有严;f各的约束,例如,我 们可以使用在RDFS中并没有定义的属性或类等等,RDFS中的元数据分 为两类 一类是Class,用于描述资源的类型;Class之间可以存在继承 关系,通过继承关系可以定义大型的分类目录,详细地分类有助于对资 源的精确描述。另一类是Property,用于描述资源的属性以及资源之间 的关系。Property本身具有Domain和Range两个属性,Domain用于表 示RDF三元关系中的subject所属的类型,Range表示RDF三元关系中object所属的类型。Or ientX是由中国人民大学WAMDM实验室自主研究开发的Nat ive XML 数据管理系统。现在,OrientX系统仍然在完善当中。OrientX以Native 方式存储XML数据,保留了 XML数据的树状结构。存储子系统中还提供 了緩沖区管理、物理页面管理、文件读写管理功能,为上层数据管理模 块提供高效的存储支持。0rientX/0ntology系统是基于OrientX系统扩展得到的外围系统, 专门处理Ontology凄t据的存储和管理;可以看作是OrientX for Ontology 的专用版本。传统的数据管理由于缺乏语义支持而受到限制,Ontology 提供的语义信息弥补了这个不足。但Ontology数据本身的管理又成为一 个新的问题。关系模式与Ontology数据的模式差异过大,不适合Ontology 数据管理;希望能够借鉴XML数据管理中的相关技术提供更有效的 Ontology数据管理。
技术实现思路
为了解决上述传统问题,因此本专利技术的一个目的就是提出了 一种本体 数据管理系统和方法。在本专利技术的一个方面中, 一种本体数据管理系统包括数据存储模 块,用于对磁盘数据页进行组织和管理且向上层提供以逻辑页为单位的 存储管理服务;数据管理模块,用于进行三元组形式的本体数据管理, 其包括三元组在数据页内的存储组织、访问、以及更新;数据处理模块, 用于负责本体数据的导入、查询、以及更新处理;以及用户界面模块,用于负责用户与系统的交互。在这个方面中,数据存储模块包括存储管理模块用于对逻辑页和 緩冲区的管理;数据集管理模块用于对数据集的相关信息的管理;以及 文件管理模块用于创建文件和对文件的各种操作。在这个方面中,数据管理模块包括类管理模块,用于对类对像进 行管理;属性管理;漠块,用于对各种属性进行管理;相同类管理模块, 用于对相同的类对像进行管理;以及不同类管理模块,用于对不同类对 像进行管理。在这个方面中,数据处理模块包括导入模块和查询模块。在这个方面中,导入模块包括RDF解析器,用于解析RDF文档;导 入推理引擎,用于在导入时对部分的数据进行推理;以及导入执行模块, 用于将解析好并完成推理的数据进行存储。在这个方面中,查询模块包括SPASQL语言解析器,用于解析SPASQL 查询语句;查询推理引擎,用于对数据推理得到隐含的数据;查询执行 模块,用于选取满足条件的数据。在这个方面中,用户界面^f莫块由API和GUI两种^:口构成,用户既 可以使用API开发上层的应用程序,也可以通过图形界面进行数据管理。在本专利技术的另 一方面中,提出了 一种用在本体数据管理系统中的导 入方法,该管理系统包括数据存储模块、数据管理^f莫块、由导入模块和 查询模块构成的数据处理模块、以及用户界面模块,其中该数据处理模 本文档来自技高网
...

【技术保护点】
一种本体数据管理系统,包括:    数据存储模块,用于对磁盘数据页进行组织和管理且向上层提供以逻辑页为单位的存储管理服务;    数据管理模块,用于进行三元组形式的本体数据管理,其包括三元组在数据页内的存储组织、访问、以及更新;    数据处理模块,用于负责本体数据的导入、查询、以及更新处理;以及    用户界面模块,用于负责用户与系统的交互。

【技术特征摘要】
1、一种本体数据管理系统,包括数据存储模块,用于对磁盘数据页进行组织和管理且向上层提供以逻辑页为单位的存储管理服务;数据管理模块,用于进行三元组形式的本体数据管理,其包括三元组在数据页内的存储组织、访问、以及更新;数据处理模块,用于负责本体数据的导入、查询、以及更新处理;以及用户界面模块,用于负责用户与系统的交互。2、 根据权利要求1的本体数据管理系统,其中数据存储模块包括 存储管理;漠块用于对逻辑页和緩沖区的管理; 数据集管理模块用于对数据集的相关信息的管理;以及 文件管理模块用于创建文件和对文件的各种操作。3、 根据权利要求1的本体数据管理系统,其中数据管理模块包括 类管理模块,用于对类对像进行管理;属性管理模块,用于对各种属性进行管理; 相同类管理模块,用于对相同的类对像进行管理;以及 不同类管理模块,用于对不同类对像进行管理。4、 根据权利要求1的本体数据管理系统,其中数据处理模块包括导入 模块和查询模块。5、 根据权利要求4的本体数据管理系统,其中导入模块包括 RDF解析器,用于解析RDF文档;导入推理引擎,用于在导入时对部分的数据进行推理;以及 导入执行模块,用于将解析好并完成推理的数据进行存储。6、 根据权利要求4的本体数据管理系统,其中查询模块包括 SPASQL语言解析器,用于解析SPASQL查询语句; 查询推理引擎,用于对数据推理得到隐含的数据; 查询执行模块,用于选取满足条件的数据。7、 根据权利要求1的本体数据管理系统,其中用户界面模块由API和 GUI两种接口构成,用户既可以使用API开发上层的应用程序,也可以通过图形界面进行数据管理。8、 一种用在本体数...

【专利技术属性】
技术研发人员:孟小峰陈妍蒋瑜欧建波
申请(专利权)人:孟小峰
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1