一种基于格雷编码的分布式数据布局方法及查询方法技术

技术编号:8241529 阅读:206 留言:0更新日期:2013-01-24 22:27
本发明专利技术属数据库技术领域,公开了一种基于格雷编码的分布式数据布局方法,其步骤为将各属性的值域范围划分为多个等份,按照格雷编码顺序编码,包含有多个属性的元组的某一属性值可以通过该值所从属的等份的格雷编码进行标识,即该属性值的索引代码,通过混洗该元组中的各属性值的索引代码进而形成该元组的一个索引键值;元组根据格雷编码的次序实现分布式数据布局,分布式数据布局部署在分布式系统,在系统的主机端实现内容感知的比图索引并以文件名存储,在系统的从机端实现数据的物理存储以及数据的统计索引。本发明专利技术还公开了一种利用上述的方法形成的数据库进行查询的方法。本发明专利技术方法得到的数据布局能够满足确切匹配查找、范围查找、多维范围查找、多属性查找、聚合分析等数据处理的需求,并且具有较高的磁盘访问效率。

【技术实现步骤摘要】

本专利技术属数据库
,具体涉及一种高效的分布式数据布局方法及查询方法。
技术介绍
追溯到20世纪70年代,IBM System R系统和伯克利大学Ingres系统的研制成功,证明了关系数据库系统处理商业数据的优越性。随后的80年代,由此模型派生出的IBMDB2, Sybase SQL Server>OracIe Database、INF0RMIX-SQL 等以事务处理(OLTP)为主的数据库系统的蓬勃发展,使数据库系统得到了充分商业化,并形成了巨大的市场价值。再到90年代,W. H. Inmon提出的整合历史数据,通过在线分析(0LAP)、数据挖掘等方法实现商业规划、决策支持等商业智能服务的数据仓库系统,为数据库系统的应用开辟了崭新的篇章,并推动文字管理、数据流处理等的发展。据IDC调查,经过十多年的发展,2008年全球商业智能分析的市值已达77. 84亿美元,占全球数据库管理系统市值204. 79亿美元的38%,并保持着每年10.6%以上的增长,显示着巨大的发展潜力。然而这一几近30年历史、一体适用(one size fits all)的数据库系统架构在当今的需求面本文档来自技高网...

【技术保护点】
一种基于格雷编码的分布式数据布局方法,其特征在于,包括下述步骤:第一步,将各属性的值域范围划分为多个等份,每个等份按照格雷编码顺序编码,由此包含有多个所述属性的元组的某一属性值可以通过该值所从属的所述等份的格雷编码进行标识,称为该属性值的索引代码,该元组其它属性值可以通过相同的方法获取索引代码,最后通过混洗该元组中的各属性值的索引代码进而形成该元组的一个索引键值;第二步,所述元组可以根据所述格雷编码的次序实现分布式数据布局,所述分布式数据布局部署在分布式系统,在所述系统的主机端实现内容感知的比图索引,并以文件名存储,在所述系统的从机端实现数据的物理存储以及数据的统计索引。

【技术特征摘要】

【专利技术属性】
技术研发人员:周敏奇周傲英
申请(专利权)人:华东师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1