【技术实现步骤摘要】
硬件友好的数据压缩方法、系统及装置
本申请是一件分案申请,母案申请号:201910972547.0,母案申请日:2019年10月10日,母案名称:硬件友好的数据压缩方法、系统及装置。
[0001]本文的公开内容涉及数据压缩,特别涉及无损压缩。
技术介绍
[0002]数据压缩在通信和计算等数字信号系统中得到了广泛的应用。例如,为了节省存储空间或传输时间,通常将计算机数据压缩为TAR或ZIP文件格式。多年来,基于亚伯拉罕
·
伦佩尔(Abraham Lempel)和雅各布
·
齐夫(Jacob Ziv)最初在1977年和1978年发表的压缩技术,开发了一系列压缩方案,这些压缩技术被称为LZ77和LZ78。LZ系列压缩方案中的一些方案有利于压缩比而不是速度,而另一些则牺牲压缩比以获得更高的速度。然而,这些各种LZ压缩技术是为通用计算系统开发的,该系统通常使用通用中央处理单元(CPU)来执行数据压缩或解压缩操作。因此,需要一种更加硬件友好的压缩技术,例如,适用于现场可编程门阵列(FPGA)或专 ...
【技术保护点】
【技术特征摘要】
1.一种方法,其特征在于,包括:将输入数据流打包为多个数据片段,每个数据片段具有最小匹配长度的长度,所述多个数据片段的第一个数据片段从所述输入数据流的起始数据单元处开始,所述第一个数据片段之后的每个数据片段从先前数据片段的第二个数据单元开始;计算所述多个数据片段中的每一个的散列值;分别基于各自的散列值,确定所述多个数据片段中的两个数据片段是与两个先前处理的数据片段的两个连续匹配;将所述两个数据片段合并到匹配序列;输出包含匹配段的压缩数据流,所述匹配段包括一个或多个匹配长度字段和一个匹配位置字段,其中所述一个或多个匹配长度字段的组合包含所述匹配序列的总长度,而所述匹配位置字段包含表示所述匹配序列的匹配位置的值。2.根据权利要求1所述的方法,其特征在于,所述两个数据片段包含两个连续的数据序列。3.根据权利要求1所述的方法,其特征在于,所述两个数据片段由等于所述两个先前处理的数据片段的匹配位置的位置差值的索引差值分开,并且所述索引差值小于或等于所述最小匹配长度。4.根据权利要求1所述的方法,其特征在于,所述匹配序列是通过合并三个或更多个匹配数据片段而获得的,任何一对连续匹配数据片段都包含连续的数据序列,或被等于一对先前处理的数据片段的匹配位置的位置差值的索引差值分开,并且所述索引差值小于或等于所述最小匹配长度。5.根据权利要求1所述的方法,其特征在于,所述匹配位置是合并到所述匹配序列中的所有匹配数据片段中的第一个匹配数据片段的位置。6.根据权利要求5所述的方法,其特征在于,所述匹配位置是从所述输入数据流的起始起的绝对索引。7.根据权利要求5所述的方法,其特征在于,所述匹配位置是相对于正在处理的数据片段的当前位置的偏移量。8.根据权利要求1所述的方法,其特征在于,还包括在散列表中保持跟踪已处理的数据的散列值。9.根据权利要求8所述的方法,其特征在于,所述散列表是以已处理的数据的散列值作为索引的字典,并且索引指向的每个条目存储与所述散列值对应的数据片段和所述数据片段在所述输入数据流中的位置。10.根据权利要求1所述的方法,其特征在于,还包括确定存在重复模式;和在所述压缩数据流中生成一个或多个重复长度字段。11.根据权利要求1所述的方法,其特征在于,所述压缩数据流还包括字面量段,其中所述字面量段包括一个或多个字面量长度字段,每个字面量长度字段之后是相应的后续字面量字段,所述一个或多个字面量长度字段的每一个包含表示所述相应的后续字面量字段的长度的值,其中,所述一个或多个字面量字段的组合包括从所述多个数据片段的一个数据片段复制的数据,所述一个数据片段在已处理的数据中不存在匹配,或者从所述多个数据
片段的连续的一系列数据片段复制的数据,所述一系列数据片段在已处理的数据中不存在匹配。12.一种装置,其特征在于,包括:编码器,包括:数据打包器,被配置为从输入数据流生成多个数据片段,每个数据片段...
【专利技术属性】
技术研发人员:ꢀ七四专利代理机构,
申请(专利权)人:英韧科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。