【技术实现步骤摘要】
本申请属于数据库,特别是涉及一种数据库二维表的可查询压缩方法。
技术介绍
1、随着大数据时代的发展,现实数据大幅度增长。结构化数据作为数据中的高质量部分,也日益增多。数据库管理系统在存储海量的结构化数据时,难免会出现存储空间不足的潜在问题。因此,数据压缩存储成为了当今数据库管理系统的核心功能之一。
2、通用压缩方法主要关注数据的统计特性,而不考虑数据的结构特征。这些方法可以应用于各种类型的数据,从文本到二进制文件都适用。通用压缩的核心思想是利用数据中的统计规律和冗余信息来减少数据的存储空间。常见的通用压缩技术有多种,比如空值压缩通过剔除空值节省空间;字典编码利用短代码替换重复数据项;块压缩分割数据块单独压缩以提高访问效率;游程编码简化连续重复数据;哈夫曼编码依据频率分配变长编码以达到理论最优压缩率;lz系列算法通过引用历史数据进行压缩。由于通用压缩方法在压缩数据后丢失了数据的结构特征,因此在针对压缩数据进行查询时,都需要全部或部分解压数据才能正常处理用户查询并返回查询结果。
3、考虑数据库二维表数据特征的压缩方法
...【技术保护点】
1.一种数据库二维表的可查询压缩方法,应用于一种数据库,所述数据库用于存储二维表,所述二维表的行由记录构成,所述二维表的列由主键和其他列字段构成,所述主键由字节数组表示,所述其他列字段的数据类型是字节数组类型和数值类型之一,每个记录中一个其他列字段的取值称为所述字段的字段值;
2.如权利要求1所述的数据库二维表的可查询压缩方法,其特征在于,当所述构造操作用于构造某个字节数组类型字段的所述字段值学习型映射树图时,所述构建操作,包括:
3.如权利要求1所述的数据库二维表的可查询压缩方法,其特征在于,当所述构造操作用于构造所述主键学习型映射树图时,所
...【技术特征摘要】
1.一种数据库二维表的可查询压缩方法,应用于一种数据库,所述数据库用于存储二维表,所述二维表的行由记录构成,所述二维表的列由主键和其他列字段构成,所述主键由字节数组表示,所述其他列字段的数据类型是字节数组类型和数值类型之一,每个记录中一个其他列字段的取值称为所述字段的字段值;
2.如权利要求1所述的数据库二维表的可查询压缩方法,其特征在于,当所述构造操作用于构造某个字节数组类型字段的所述字段值学习型映射树图时,所述构建操作,包括:
3.如权利要求1所述的数据库二维表的可查询压缩方法,其特征在于,当所述构造操作用于构造所述主键学习型映射树图时,所述构建操作,包括:
4.如权利要求2所述的数据库二维表的可查询压缩方法,其特征在于,所述根据所述字段值数目n和预设的期望条目数e确定所述根节点的条目个数n;将所述输入集作为所述转换函数...
【专利技术属性】
技术研发人员:杜剑峰,张世明,
申请(专利权)人:贝格迈思深圳技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。