一种基于LZ77的压缩方法、装置及其介质制造方法及图纸

技术编号:33647615 阅读:28 留言:0更新日期:2022-06-02 20:24
本申请公开了一种基于LZ77的压缩方法、装置及其介质,针对目前使用单字节匹配的方式需要消耗大量硬件资源的问题,提供了一种基于LZ77的压缩方法,包括:获取待压缩数据;由于通常在获取待压缩数据时以字为匹配单元,所以将待压缩数据以双字节的步进进行数据匹配,获取与后续数据匹配的匹配字符串时,减少了重复进行匹配的次数,以实现降低硬件资源的消耗;再获取匹配字符串的LE值和DI值;将获取到的LE值与DI值组成匹配对,并将待压缩数据中的匹配字符串替换成匹配对;待所有待压缩数据进行完数据匹配并将匹配字符串替换成匹配对之后,得到压缩数据,完成整个压缩过程。完成整个压缩过程。完成整个压缩过程。

【技术实现步骤摘要】
一种基于LZ77的压缩方法、装置及其介质


[0001]本申请涉及计算机数据压缩
,特别是涉及一种基于LZ77的压缩方法、装置及其介质。

技术介绍

[0002]在目前的通信、计算机文件存档等方面,常需要对数据进行压缩处理,其中,以LZ77编码使用的尤为广泛。LZ77编码总会包含一个动态窗口(Sliding Window)和一个预读缓冲器(Read Ahead Buffer)。动态窗口是个历史缓冲器,它被用来存放输入流的前m个字节的有关信息,一个动态窗口的数据范围最大可以到64K;预读缓冲器是与动态窗口相对应的,它被用来存放输入流的前n个字节,预读缓冲器的大小通常在0至258之间,用下n个字节填充预读缓冲器;然后在动态窗口中寻找与预读缓冲器中的最匹配的数据,如果匹配的数据长度大于最小匹配长度(通常取决于编码器,以及动态窗口的大小,比如一个4K的动态窗口,它的最小匹配长度就是2),那么就输出一对<长度,距离>数组,将这对数组称之为匹配对。长度(length,LE)是匹配的数据长度,而距离(distance,DI)则说本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于LZ77的压缩方法,其特征在于,包括:获取待压缩数据;将所述待压缩数据以双字节的步进进行数据匹配,获取与后续数据匹配的匹配字符串;其中,所述后续数据至少为两个字节;获取所述匹配字符串的LE值和DI值;其中,所述LE值为所述匹配字符串的长度,所述DI值为所述匹配字符串和与其匹配的所述后续数据之间的距离;将获取到的所述LE值与所述DI值组成匹配对,并将所述待压缩数据中的所述匹配字符串替换成所述匹配对;待所有所述待压缩数据进行完所述数据匹配并将所述匹配字符串替换成所述匹配对之后,得到压缩数据。2.根据权利要求1所述的基于LZ77的压缩方法,其特征在于,在所述获取匹配的字符串之后,还包括:将所述匹配字符串前后的单字节进行重新匹配,以获取新的所述匹配字符串。3.根据权利要求1所述的基于LZ77的压缩方法,其特征在于,当所述匹配对中的所述LE值超过预读缓冲器所能容纳的字节数时,本方法还包括:将所述匹配对根据所述LE值拆解成多对所述匹配对,其中,拆解后的所述匹配对的所述LE值不超过所述预读缓冲器所能容纳的字节数。4.根据权利要求1所述的基于LZ77的压缩方法,其特征在于,所述将所述待压缩数据中的所述匹配字符串替换成所述匹配对包括:所述匹配字符串的原始数据被替换成所述匹配对为按字节一一替换,不足处以空气泡标记替换所述原始数据;对应的,所述得到压缩数据之前还包括:去除所述待压缩数据中的所述空气泡标记。5.根据权利要求1至4任意一项所述的基于LZ77的压缩方法,其特征在于,所述获取待压缩数据包括:根据所述待压缩数据的哈希值以四字节作为匹配单元获取所述待压缩数据;对应的,获取到所述待压缩数据后,还包括:判断所述待压缩数据是否满足匹配规则,其中,所述匹配规则包括:根据所述DI值确定的数据是...

【专利技术属性】
技术研发人员:张磊李树青王凛
申请(专利权)人:山东云海国创云计算装备产业创新中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1