一种面向列存储DWMS的B+树索引方法技术

技术编号：7613661 阅读：286 留言：0更新日期：2012-07-26 22:14

本发明专利技术涉及一种面向列存储DWMS的B+树索引方法，其特征在于，步骤为：步骤1、列数据生成；步骤2、若B+树关键字为行号，则转向步骤4进行创建，否则转步骤3进行排序；步骤3、将多路归并和堆排序组合使用对列值数据进行排序；步骤4、B+树索引初始化；步骤5、创建叶子结点；步骤6、自底向上产生中间结点。本发明专利技术提供一种应用于列存储DWMS的B+树索引具有如下优点：1)保证B树层次最短，减少了查找次数；2)B+树的建立抛弃了传统的插入法，使用自底向上构造B+树的方法。使用这种方法不需要考虑分裂操作，减少了大量的开销。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种面向列存储DWMS (Data Warehouse Management System)的B+树索引技术。
技术介绍
互联网应用的高度发展，高吞吐量和大存储量成为现如今数据库产品所必备的特点，对于事务处理和查询分析高性能的要求日益迫切。传统的行存储数据库并不能像处理事务应用一样为企业决策提供高效的查询分析，近年列存储的数据库架构被重新审视，对于数据仓库中或者分析支持应用中读优化的查询型工作，列存储表现出比行存储具有更加显著的性能。由于关系表在对外表现上，仍为逻辑行，因此元组重构与多表连接是列存储中影响查询性能的重要因素。索引是提高查询效率的重要技术之一。B+树索引能够保持数据有序存储，并具有允许查找、顺序存取、插入和删除的优点，使得它在事务环境中成为数据库系统使用最广泛的索引结构。在传统的数据库系统中，频繁的数据插入和修改带来的B+树结构的变化是很大的。为了降低数据插入和修改时造成结点分裂的可能性，B+树的结点并不是填满的。但是在数据仓库系统中，几乎没有数据插入和修改操作。将传统B+树应用于海量数据存储的数据仓库系统中将造成空间的浪费。同时，由于结点并未完全填充，数据存储需要更多的结点，这将增加B+树索引的高度，降低数据的查询效率。
技术实现思路
本专利技术的目的是提供一种应用于列存储DWMS的B+树索引，克服传统B+树索引的局限性，提高数据的查询效率。为了达到上述目的，本专利技术的技术方案是提供了一种面向列存储DWMS的B+树索引方法，其特征在于，步骤为步骤I、列数据生成导入用户数据，将原始按行存储的数据垂直划分为单列，为每一列的每一项数...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：夏小玲，乐嘉锦，王梅，李晔锋，
申请(专利权)人：东华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人