保证语义正确性的动态分层集成数据访问方法技术

技术编号:8594059 阅读:264 留言:0更新日期:2013-04-18 07:16
本发明专利技术公开了一种保证语义正确性的动态分层集成数据访问方法,目的是解决如何在大规模关系数据库集成条件下,提供语义完全正确的数据访问。技术方案为,先对描述逻辑子集DL-LiteA进行扩展得到然后基于描述逻辑进行本体TBox分层,并建立关系数据库和本体之间的LAV映射和O-GAV映射。再根据TBox分层中的TQ,采用SuperRef算法对查询请求进行扩展重写,构建包含查询结果动态ABox?AQ。最后,对ABox?AQ进行求精,返回查询应答结果。采用本发明专利技术能够向用户提供语义完全正确的数据,满足集成数据访问中对于语义正确性的需求,且可降低计算复杂度,提高扩展查询重写的效率。

【技术实现步骤摘要】

本专利技术涉及数据工程领域的集成数据访问方法。
技术介绍
数据是驱动现代企业业务发展的关键要素之一,实现数据资产业务价值的最大化是当代企业的首要目标之一。然而,虽然企业数据资产的逐年递增,但是当前利用信息的能力和手段仍然相对落后,信息过载(Information Overloading)问题已经越来越成为困扰人们的难题。造成这一问题的根本原因在于人们在信息系统的建设过程中忽视顶层规划和设计,导致现有的数据环境异常复杂,数据的综合利用难度极大。因此,企业和科研机构在数据集成和访问方面的投入开始逐年增加。有调查表明,到2012年为止,全球在数据集成和访问技术方面的投入将会增长到30亿美元以上。数据集成技术已经发展了三十多年,到目前为止可分为以数据仓库为代表的物化集成方式(Materialized Approach)和以Wrapper/Mediator为代表的虚拟集成方式(Virtual Approach)。其中,前者建造和维护的成本高昂,时效性也存在明显缺陷;而后者则较为灵活,更适合于对Web环境下自治、分布式的关系数据源进行集成。现有的数据集成方案通常在语法层面或者术语语义层面解决关本文档来自技高网...

【技术保护点】
一种保证语义正确性的动态分层集成数据访问方法,其特征在于包括以下步骤:第一步,对DL?Lite系列中的描述逻辑子集DL?LiteA进行如下扩展,得到DL?Lite是一种保证在大型数据集上仍然具有多项式级时间的推理的描述逻辑。1.1增加值约束;1.2增加非受限数量约束;1.3增加对称关系、反对称关系、自反关系和反自反关系;1.4去除角色包含公理;第二步,基于描述逻辑进行本体TBox分层,这里的本体是在OWL1DL本体的基础上应用SWRL规则得到的,具有一阶逻辑的表达能力;其中,本体TBox是描述概念之间相互关系的术语公理集,OWL1?DL是OWL1的子语言,SWRL是以语义的方式呈现规则的一种语...

【技术特征摘要】
1. ー种保证语义正确性的动态分层集成数据访问方法,其特征在于包括以下步骤 第ー步,对DL-Lite系列中的描述逻辑子集DL-LiteA进行如下扩展,得到DL-LiteニT ,DL-Lite是ー种保证在大型数据集上仍然具有多项式级时间的推理的描述逻辑。1.1増加值约束;1. 2増加非受限数量约束;1. 3增加对称关系、反对称关系、自反关系和反自反关系; [1.4去除角色包含公理; 第二步,基于DしLite:.,描述逻辑进行本体TBox分层,这里的本体是在OWLlDL本体的基础上应用SWRL规则得到的,具有一阶逻辑的表达能力;其中,本体TBox是描述概念之间相互关系的术语公理集,OffLl DL是OWLl的子语言,SffRL是以语义的方式呈现规则的ー种语言;本体TBox分层的步骤如下 [2.1将满足DL-Lite^w中肯定概念包含公理的子集从本体TBox中划分出来,作为第一个分层,记作Tq; [2. 2将满足DL-Litel1中角色与概念特性的约束性公理、否定包含公理的子集从本体TBox中划分出来,作为第二个分层,记作Tcst ; [2. 3将满足OWLl DL本体中其他无法由Dししゎ;^语法构造进行 等价代换的剩余公理子集从本体TBox中划分出来,作为第三个分层,记作I;,满足这一层约束公理的个体是OWLlDL本体的合法实例,剩余公理子集包含的公理有概念的交和并、命名个体、角色传递、角色包含和等价运算; [2.4将用SWRL描述的Horn逻辑规则从本体TBox中划分出来,作为第四个分层; 第三步,建立关系数据库和本体之间的LAV映射和O-GAV映射,其中,LAV是局部视图法,O-GAV是面向对象的全局视图法,具体步骤如下 [3.1基于概念连接图和实体树构造LAV映射,编码生成表示和存储LAV映射的XML文件,所述概念连接图为ニ元组〈CNode,Edge〉,CNode为概念连接图中的节点集合,Edge为概念连接图中的边集合;所述实体树的根节点为DしLiteごm本体中的概念,描述关系模式中隐含的一个实体集,实体树的叶节点为一个序偶〈col,dp>,其中col为关系模式中的列,dp为本体中的概念特性; [3.2采用面向对象的全局视图OGMG方法构造O-GAV映射,方法是 [3.2.1根据分层TBox的Tq分层进行LAV映射分类,通过遍历Tq中的概念集合和LAV映射集合,将含有同一概念的LAV映射分为ー类; [3.2. 2依据LAV映射中的标识变量对映射中隐含的语义信息进行划分,将同一 LAV映射中使用同一变量标识的合取项分为ー类; [3.2. 3构造O-GAV映射的首部和体部根据与同一概念相关的合取项分别构造O-GAV映射的首部和体部,其中,首部是只包含基本概念的映射,其余映射为映射的体部; [3.2. 4合并O-GAV映射,将属于同一概念体的信息加以整合,即对首部中包含同一概念信息的O-GAV映射进行合并; [3.2. 5对O-GAV映射进行编码,得到包含O-GAV映射集合的映射文件; 第四步,采用SuperRef 算法对查...

【专利技术属性】
技术研发人员:姚莉唐富年封孝生刘芳张群郝智勇李金洋袁金平
申请(专利权)人:中国人民解放军国防科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1