【技术实现步骤摘要】
数据压缩方法、装置和计算机可读存储介质
[0001]本说明书涉及数据压缩
,具体地,涉及一种数据压缩方法、用于该数据压缩方法的装置和计算机可读存储介质。
技术介绍
[0002]在大数据技术的应用中,大量的数据一般是在大量的服务器上并行处理的,该些服务器之间会存在大量的信息传输,该些信息需要通过压缩和加密进行传输和保存。数据压缩的硬件实现方式可以减少服务器的任务量,以提高数据的压缩速度。
[0003]然而,当前的压缩算法的硬件实现通常在得到匹配信息后直接对数据进行封装输出,这不可避免会存在近距离短匹配拦截等情况,使得数据的压缩率难以进一步提高。
技术实现思路
[0004]本说明书第一方面提供一种数据压缩方法,该数据压缩方法包括:从待压缩数据对象中获取位置P的待压缩数据;在已压缩数据中查找位置P的第一匹配数据,并确定第一偏移量和第一匹配长度M,其中,第一偏移量用于表示位置P相对于第一匹配数据的偏移量,第一匹配长度M用于表示第一匹配数据的长度;在已压缩数据中查找位置P
‑
i的第二匹配 ...
【技术保护点】
【技术特征摘要】
1.一种数据压缩方法,其特征在于,包括:从待压缩数据对象中获取位置P的待压缩数据;在已压缩数据中查找位置P的第一匹配数据,并确定第一偏移量和第一匹配长度M,其中,所述第一偏移量用于表示所述位置P相对于所述第一匹配数据的偏移量,所述第一匹配长度M用于表示所述第一匹配数据的长度;在所述已压缩数据中查找位置P
‑
i的第二匹配数据,并确定第二偏移量和第二匹配长度N,所述第二偏移量用于表示所述第二匹配数据相对于所述位置P
‑
i的偏移量,所述第二匹配长度N用于表示所述第二匹配数据的长度,且M、N和i都为正整数;若M小于N
‑
i,则将所述第一偏移量调整为所述第二偏移量,得到调整后的偏移量,并将所述第一匹配长度M的终点调整为所述第二匹配长度N的终点,得到调整后的匹配长度M
’
;基于所述调整后的偏移量和所述调整后的匹配长度M
’
对所述位置P的待压缩数据进行替换,以压缩所述待压缩数据。2.根据权利要求1所述的数据压缩方法,其特征在于,还包括:若M大于或等于N
‑
i,则基于所述第一偏移量和所述第一匹配长度M对所述位置P的待压缩数据进行替换,以压缩所述待压缩数据。3.根据权利要求2所述的数据压缩方法,其特征在于,还包括:在所述位置P
‑
i为上一已压缩数据的结束位置的情况下,执行在所述已压缩数据中查找位置P
‑
i的第二匹配数据的步骤。4.根据权利要求1至3中的任一项所述的数据压缩方法,其特征在于,所述基于所述调整后的偏移量和所述调整后的匹配长度对所述位置P的待压缩数据进行替换,以压缩所述待压缩数据,包括:确定位置P+j的匹配长度Q,其中,j和Q都为正整数;若位置P与位置P+j之间的位置在所述已压缩数据中无匹配数据的匹配长度为零且M
’
小于Q
‑
j,则对所述P位置的待压缩数据进行压缩,并将P+j赋值给P,以迭代执行确定位置P+j的匹配长度Q的步骤;若M
’
大于或等于Q
‑
j,则执行基于所述调整后的偏移量和所述调整后的匹配长度对所述位置P的待压缩数据进行替换的步骤,并将P+M
’
赋值给P,以迭代执行确定位置P+j的匹配长度Q的步骤。5.根据权利要求4所述的数据压缩方法,其特征在于,j=2。6.根据权利要求4所述的数据压缩方法,其特征在于,所述位置P+j之后的位置P+k在所述已压缩数据中无匹配数据,其中,k为正整数,所述数据压缩方法还包括:若Q大于或等于M
’
+j,则对所述位置P的待压缩数据进行压缩,并将P+j赋值给P,以迭代执行确定位置P+j的匹配长度Q的步骤,否则,执行基于所述调整后的偏移量和所述调整后的匹配长度对所述位置P的待压缩数据进行替换的步骤,并将P+M
’
赋值给P,以迭代执行确定位置P+j的匹配长度Q的步骤。7.根据权利要求6所述的数据压缩方法,其特征在于,j=1,并且k=2。8.根据权利要求4所述的数据压缩方法,其特征在于,所述位置P与所述P+j之间的位置P+i...
【专利技术属性】
技术研发人员:杨倩,任麒斌,蒋东华,刘泽华,李哲,袁信,曾鸣,许浩,
申请(专利权)人:阿里巴巴中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。