【技术实现步骤摘要】
嵌入式设备文件系统数据的快速无损压缩方法
本专利技术属于数据处理
,涉及嵌入式设备文件系统的数据压缩方法,可应用于存储受限的嵌入式设备中。
技术介绍
近些年来,随着移动互联网的发展,嵌入式设备如手机、平板已经成为人们必备的一种通信工具。文件系统对于嵌入式设备来说是一个不可缺的部分,它允许用户上载和存储文件并提供对数据的访问。然而由于嵌入式设备的存储受限,如果能对其文件系统数据进行压缩,节省存储空间,则可以提高设备的整体性能。现代社会信息量的不断增长,人们对嵌入式设备的系统性能也提出了更高的要求,如更高的速度、更低的耗能、更小的体积、能存取更多的信息等等。为了达到上面的各种性能要求,人们提出了各种改进的方法。其中,比较廉价的改进方法之一是无损数据压缩技术。如若在嵌入式设备中运用无损数据压缩技术,则在文件系统数据存储空间更小,传输中占用更小的带宽,也可以降低频繁的物理磁盘与CPU之间的I/O读取,从而延长了存储设备的寿命和节省能耗。鉴于上述技术的各种优点,运用这种简单而廉价的改进嵌入式系统性能的技术,研究无损数据压缩技术是很有必要的。以色列学者Lempel和Ziv于1977年提出了一种高效率的无损压缩编码技术,即LZ77压缩算法,该压缩算法的主要原理是利用较短的标记代替前面出现过的重复字符串,标记格式为重复长度和偏移距离,如abcdekabcdeha,则可以编码成abcdek(5,6)ha表示,这样从整体上而言,较短的信息代替较长的信息,从而达到了压缩的效果。1982年,JamesStorer和ThomasSzymanski在LZ77基础上将算法进行改进 ...
【技术保护点】
一种嵌入式设备文件系统数据的快速无损压缩方法,包括如下步骤:(1)读取嵌入式设备中的文件系统数据与文件系统数据的长度;(2)判断所读数据是否为新数据,若所读数据没有记录在字典中,则判断为新数据,并把新数据位置记入字典中,继续读取文件系统数据,直到未出现新数据为止;若所读数据已记录在字典中,则对所读数据进行如下压缩编码:2a)对于字符重复长度和新字符长度均小于8,且偏移距离小于1K的文件系统数据,首字节依次记录字符重复长度L1、新字符长度L2和偏移距离D的高位比特,从第二个字节开始依次记录新字符C和偏移距离D低位比特;2b)对于字符重复长度或新字符长度大于8,且偏移距离大于等于1K小于4K的文件系统数据,首字节依次记录压缩格式标志T、字符重复长度L1和偏移距离D高位比特,从第二个字节开始依次记录新字符长度L2、新字符C和偏移距离D低位比特;2c)对于字符重复长度或新字符长度大于8,且偏移距离大于等于4K的文件系统数据,首字节依次记录压缩格式标志T、字符重复长度L1和偏移距离D高位比特,从第二个字节开始依次记录新字符长度L2、新字符C和偏移距离D低位比特;(3)判断所读数据是否压缩编码至结 ...
【技术特征摘要】
1.一种嵌入式设备文件系统数据的快速无损压缩方法,包括如下步骤:(1)读取嵌入式设备中的文件系统数据与文件系统数据的长度;(2)判断所读数据是否为新数据,若所读数据没有记录在字典中,则判断为新数据,并把新数据位置记入字典中,继续读取文件系统数据,直到未出现新数据为止;若所读数据已记录在字典中,则对所读数据进行如下压缩编码:2a)对于字符重复长度和新字符长度均小于8,且偏移距离小于1K的文件系统数据,首字节依次记录字符重复长度L1、新字符长度L2和偏移距离D高位比特,从第二个字节开始依次记录新字符C和偏移距离D低位比特;2b)对于字符重复长度或新字符长度大于8,且偏移距离大于等于1K小于4K的文件系统数据,首字节依次记录压缩格式标志T、字符重复长度L1和偏移距离D高位比特,从第二个字节开始依次记录新字符长度L2、新字符C和偏移距离D低位比特;2c)对于字符重复长度或新字符长度大于8,且偏移距离大于等于4K的文件系统数据,首字节依次记录压缩格式标志T、字符重复长度L1和偏移距离D高位比特,从第二个字节开始依次记录新字符长度L2、新字符C和偏移距离D低位比特;(3)判断所读数据是否压缩编码至结尾,若是,则输出压缩编码后的数据和数据长度,并记录结束标志,否则返回步骤(2)。2.根据权利要求1所述的嵌入式设备文件系统数据的快速无损压缩方法,其特征在于:所述步骤(2)中的字典,是根据关键值直接访问的哈希表结构,关键值是通过哈希函数计算得出,哈希函数的设计为:从输入文件系统数据中读入四个字节,用前两个字节做异或操作得到新字节A1,用后两个字节做异或操作得到新字节A2,用字节A1的低位2比特与字节A2的高位2比特做异或操作得到14比特的关键值。3.根据权利要求1所述的嵌入式设备文件系统数据的快速无损压缩方法,其特征在于:步骤2a)所述的首字节依次记录字符重复长度L1、新字符长度L2和偏移距离D高位比特,从第二个字节开始依次记录新字符C和偏移距离D低位比特,按如下规则记录:(2a1)首字节的前3比特记录重复字符长度L1,第4、5、6比特记录新字符长度L2;(2a2)从第...
【专利技术属性】
技术研发人员:田方,宋彬,裴远,李慧玲,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。