一种数据压缩方法、数据解压方法及装置制造方法及图纸

技术编号:37763880 阅读:27 留言:0更新日期:2023-06-06 13:21
本说明书实施例提供了一种数据压缩方法、数据解压方法及装置,获取数据集合,并基于获取的数据集合和预设值设置规则,确定所述数据集合中每个数据对应的预设值;针对数据集合中每个未编码数据,执行:将该未编码数据与该未编码数据对应的预设值进行异或,得到该未编码数据对应的异或值,并确定该异或值中预设格式数值的数量;生成索引字节和有效负载字节;所述索引字节包括:用于表征预设格式数值的数量的数据;所述有效负载字节为该未编码数据去除预设格式数值后剩余的数据;将生成的索引字节和有效负载字节作为该未编码数据对应的编码数据;针对数据集合对应的所有编码数据,通过删除重复字节的方式进行压缩,得到压缩后的数据。据。据。

【技术实现步骤摘要】
一种数据压缩方法、数据解压方法及装置


[0001]本说明书一个或多个实施例涉及计算机
,尤其涉及一种数据压缩方法、数据解压方法及装置。

技术介绍

[0002]计算机中存储的数据较多,为了更好的节约存储资源和传输带宽,需要对数据进行压缩。而相关技术中,数据的压缩方法的压缩率仍不满足预期。

技术实现思路

[0003]有鉴于此,本说明书一个或多个实施例提供一种数据压缩方法、数据解压方法及装置。
[0004]根据本说明书一个或多个实施例的第一方面,提出了一种数据压缩方法,包括:
[0005]获取数据集合,并基于获取的数据集合和预设值设置规则,确定所述数据集合中每个数据对应的预设值;所述数据集合包括至少两个数据;
[0006]针对数据集合中每个未编码数据,执行:
[0007]将该未编码数据与该未编码数据对应的预设值进行异或,得到该未编码数据对应的异或值,并确定该异或值中预设格式数值的数量;
[0008]生成索引字节和有效负载字节;所述索引字节包括:用于表征预设格式数值的数量的数据;所述有效负载本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据压缩方法,包括:获取数据集合,并基于获取的数据集合和预设值设置规则,确定所述数据集合中每个数据对应的预设值;所述数据集合包括至少两个数据;针对数据集合中每个未编码数据,执行:将该未编码数据与该未编码数据对应的预设值进行异或,得到该未编码数据对应的异或值,并确定该异或值中预设格式数值的数量;生成索引字节和有效负载字节;所述索引字节包括:用于表征预设格式数值的数量的数据;所述有效负载字节为该未编码数据去除预设格式数值后剩余的数据;将生成的索引字节和有效负载字节作为该未编码数据对应的编码数据;针对数据集合对应的所有编码数据,通过删除重复字节的方式进行压缩,得到压缩后的数据。2.根据权利要求1所述的方法,所述基于获取的数据集合和预设值设置规则,确定所述数据集合中每个数据对应的预设值,包括:基于预设值获取规则和获取的数据集合,获取预设的固定值;将预设的固定值作为所述数据集合中每个数据对应的预设值,并存储所述预设的固定值。3.根据权利要求2所述的方法,所述基于预设的固定值获取规则,基于获取的数据集合获取预设的固定值,包括:将所述数据集合中的第N个值作为预设的固定值;所述N为预设正整数。4.根据权利要求1所述的方法,所述预设格式数值为前导零和尾随零;所述确定该异或值中预设格式数值的数量,包括:确定该异或值中的前导零字节的数量和尾随零字节的数量,所述前导零字节用于表征字节中所有比特都为前导零的字节,所述尾随零字节用于表征字节中所有比特都为尾随零的字节;所述生成索引字节,包括:将所述前导零字节的数量和尾随零字节的数量编码到同一个字节中,作为索引字节。5.根据权利要求1所述的方法,所述针对数据集合对应的所有编码数据,通过删除重复字节的方式进行压缩,得到压缩后的数据,包括:将所述数据集合中所有的数据对应的索引字节组成索引字节集合,并将所述数据集合中所有的数据对应的有效负载字节组成有效负载字节集合;将所述索引字节集合和所述有效负载字节集合输入字节流压缩器,得到压缩后的数据。6.根据权利要求1所述的方法,所述通过删除重复字节的方式进行压缩,包括:通过以下任意一种字节流压缩器进行压缩:Zlib压缩器、lzo压缩器、snappy压缩器、zstd压缩器。7.根据权利要求1所述的方法,所述数据集合包括的数据为时间序列数据。8.一种数据解压方法,包括:恢复压缩数据集合中的重复字节,得到编码数据集合;所述压缩数据集合是通过权利要求1

7任一项的方法对数据集合进行压缩得到的数据集合;
针对编码数据集合中每个...

【专利技术属性】
技术研发人员:张峥
申请(专利权)人:阿里云计算有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1