一种关系数据库的XML文档存储和查询的方法技术

技术编号:10040243 阅读:174 留言:0更新日期:2014-05-14 10:50
一种关系数据库的XML文档存储和查询的方法:本发明专利技术对XML数据的关系存储、路径表达式的查询处理等方面进行了深入的研究和探讨,提出了一种新的利用关系数据库存储和查询XML数据的方法,这种方法将XML文档树中有文本值的节点和无文本值的节点分别存储在两个关系表中,它不关心文档DTD的模式信息,也不需要建立任何索引结构。

【技术实现步骤摘要】

 一种关系数据库的XML文档存储和查询的方法主要是涉及计算机领域中的数据存储技术。
技术介绍
由于关系数据库是目前最成熟的一种数据管理技术,在存储和管理XML数据的各种方式中,基于关系数据库的XML数据存储和处理技术显然是~种可行而有效的方式,并在学术界受到了广泛的关注。然而,由于数据模型的差异,利用关系数据库存储和查询XML数据给传统数据库技术带来了许多新的挑战。
技术实现思路
通过国家专利检索没有发现关于此系统方面的申请资料。本专利技术比较了现有的XML数据存储和查询技术的优缺点,提出了一种新的利用关系数据库存储和查询XML数据的方法,并给出具体的存储映射算法和查询转换算法。利用存储映射算法,可将XML文档无损地存储到固定模式的关系表中:查询转换算法是将查询XML文档的路径表达式的核心子集转换成SQL语句。1、本专利技术提出了一种新的XML文档基于路径的关系存储方法该方法是一种模式映射,它使用固定的关系模式存储各种结构互异的XML文档,并且这种关系模式不考虑文档DTD的信息,因此不受它变化的限制。由于这种映射方法产生的关系表结构固定,因此为XML文档的查询带来了极大的便利。该基于路径的存储方法全面地考虑了xML文档树中的每个节点信息、边信息和值信息,将XML文档中所有的嵌套关系都采用了两个表来存储:~个叫值表(Value Table),它用来存储XML文档中所有有文本值的元素/属性的相关信息;另一个叫非值表(NoValueTable),它用来记录XML文档中所有无文本值的中间元素的相关信息。2、本专利技术针对基于路径的存储方法,提出了一种查询处理机制。这种查询机制采用表连接的方法来处理路径表达式,查询时需充分利用Value Table的路径信息,来减少由于表连接而带来的查询代价。3、在用户数据库中再添加一个新表来存储每条路径的信息,这个表命名为路径表(Path Table)。路径表中每个记录是标识不同路径的一个二元组<pathid,path>,path记录XML文档树中所有不同的路径,而pathid贝lJ是为这些各不相同的路径设置的唯一的标识符。这样就会避免重复地存储相同路径而带来的存储冗余。添加了路径表后,在值表中就不再需要存储每条路径的全部信息,而只要存储它们对应NpathidBP。本文档来自技高网...

【技术保护点】
一种关系数据库的XML文档存储和查询的方法,其特征是利用存储映射算法,可将XML文档无损地存储到固定模式的关系表中,查询转换算法是将查询XML文档的路径表达式的核心子集转换成SQL语句。

【技术特征摘要】
1.一种关系数据库的XML文档存储和查询的方法,其特征是利用存储映射算法,可将XML文档无损地存储到固定模式的关系表中,查询转换算法是将查询XML文档的路径表达式的核心子集转换成SQL语句。
2.根据权限要求1的存储结构,提出了新的适用于该存储方法的基于表连接的查询机制,以及相应的查询转换算法;对于不同形式的路径表达式,都可以采用该查询转换算法将其转换为对应的S...

【专利技术属性】
技术研发人员:罗正伟
申请(专利权)人:镇江华扬信息科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1