【技术实现步骤摘要】
本专利技术涉及数据库系统及信息压缩领域,尤指一种元组级。
技术介绍
在大型数据库应用系统中,经常需要处理数百Gb、甚至上Tb级的数据,这些数据通常被保存在大规模磁盘阵列中。一方面,大规模磁盘阵列的使用对系统硬件成本的贡献不可小视;另一方面,大量的磁盘读写操作也使得输入/输出成为系统的主要性能瓶颈。若采用数据库压缩方法,对存储的数据进行压缩,可显著减少数据的磁盘占用,从而大大降低系统的硬件成本,同时还能提高系统的整体性能。现有的数据库压缩产品主要有Winzip,Winrar等,这些产品都是基于通用的压缩方法,例如LZ(其全称为Lempel-Ziv,是用两位作者Abraham Lempel和Jacob Ziv的名字命名的)算法和LZW(其全称为Lempel-Ziv-Welch,是用三位作者Abraham Lempel、Jacob Ziv和Terry A.Welch的名字命名的)算法,这些压缩算法的基本假设是数据中存在有大量重复出现的子串,如数据“ABCDABC”中的子串“ABC”,通过将这些重复出现的子串用更短的编码表示来达到压缩的目的;同时,压缩算法必须在压缩后 ...
【技术保护点】
一种数据库压缩方法,其特征在于,包括以下步骤:a.建立数据库元组的每一种属性类型的压缩方法集,并对每一种压缩方法进行编号;b.根据数据库元组的属性类型及值从该属性类型的压缩方法集中选择压缩方法,并将该压缩方法的编号存放在压缩 后元组的头部;c.利用压缩后元组头部存放的压缩方法的编号所对应的压缩方法对数据库元组的属性值进行压缩,并将压缩后的属性值存放在压缩后元组中。
【技术特征摘要】
1.一种数据库压缩方法,其特征在于,包括以下步骤a.建立数据库元组的每一种属性类型的压缩方法集,并对每一种压缩方法进行编号;b.根据数据库元组的属性类型及值从该属性类型的压缩方法集中选择压缩方法,并将该压缩方法的编号存放在压缩后元组的头部;c.利用压缩后元组头部存放的压缩方法的编号所对应的压缩方法对数据库元组的属性值进行压缩,并将压缩后的属性值存放在压缩后元组中。2.如权利要求1所述的数据库压缩方法,其特征在于,在所述步骤a中,所述属性类型为整数型,建立的压缩方法集为若所述属性值小于256,则将其压缩为一个字节,解压时将其扩展为四个字节,并将高位前三个字节设为0,并将其编号设为2;若所述属性值大于等于256且小于65536,则将其压缩为两个字节,解压时将其扩展为四个字节,并将高位前两个字节设为0,并将其编号设为3;若所述属性值大于等于65536且小于224,则将其压缩为三个字节,解压时将其扩展为四个字节,并将高位前一个字节设为0,并将其编号设为4。3.如权利要求1所述的数据库压缩方法,其特征在于,在所述步骤a中,所述属性类型为字符串,建立的压缩方法集为若所述字符串由中文字符构成,则其所有字符的高位均为1,将每个字符压缩为七个位,解压时将每七个位扩展为1个字节,并将其高位设为1,并将...
【专利技术属性】
技术研发人员:陈刚,冯柯,何清法,陈池,
申请(专利权)人:北京神舟航天软件技术有限公司,
类型:发明
国别省市:11[中国|北京]