X-BIT压缩编码算法制造技术

技术编号：8273305 阅读：263 留言：0更新日期：2013-01-31 05:51

本发明专利技术涉及数据压缩领域，公开了一种X-BIT压缩编码算法，具体压缩过程如下，首先数据准备并转换，然后对数据依次进行时间差分、值排序、计算序号最大位数、生成序号压缩流、生成状态压缩流、生成时差压缩流、生成差值压缩流，最后将之前各个步骤输出的结果组合成一个字节流，即是压缩结果。与现有技术相比，本发明专利技术的有益效果是：1、压缩率高；2、数据无失真；3、解压效率高。

全部详细技术资料下载

【技术实现步骤摘要】
本专利技术涉及数据压缩领域，具体为一种X-BIT压缩编码算法。
技术介绍
实时数据库广泛应用于电力、电信、钢铁、石油化工、装备制造等领域，主要用于存储工业生产过程中测量点数据(包括点ID、值、时间戳、点状态)，负责实时数据(当前测量点值)的读写和历史数据(过去的值)读取，是一种时序数据，它的主要特点是短时间内数据值相差不大。对于历史数据的压缩，一般使用的以字符为依据的通用压缩算法(如ZIP、RAR等)是无法达到理解效果的，有时压缩的结果可能比未压缩前更占空间大。目前在业内使用最多的两种实时数据压缩算法是PI使用的旋转门压缩算法和EDNA使用的霍夫曼压缩算法。旋转门压缩算法的压缩比高，但它是有损压缩，数据有失真，对于某些高精度的要求无法满足。哈夫曼压缩算法是编码压缩的一种，通过构造哈夫曼树来实现编码和压缩，哈夫曼压缩算法属于无损压缩，但是要想得到较高的压缩率，需要进行一些特殊的处理。以EDNA为例，虽然它通过一些特殊的处理提高了压缩比，但确牺牲了历史数据的检索效率。现有技术还存在以下缺点1、目前使用的按字节压缩(如ZIP、RAR、霍夫曼)主要缺点是压缩率比较低，对二进制数据压缩，压缩率更低。2、有损压缩(旋转门)虽然压缩率比较高，但是数据有一定的失真。
技术实现思路
本专利技术所解决的技术问题在于提供一种X-BIT压缩编码算法，以解决实时数据库中，历史数据压缩问题，保证了数据不失真的情况下，提高数据的压缩率，减少磁盘的占用，提高海量数据存储能力。本专利技术所解决的技术问题采用以下技术方案来实现 X-BIT压缩编码算法，具体压缩过程如下 (1)数据准备并转换数据在...

【技术保护点】
X？BIT压缩编码算法，其特征是：具体压缩过程如下：（1）数据准备并转换：数据在经过实时服务处理后，时间戳将转换成以秒为单位的UTC时间，每条记录用13个字节来存储原始数据；（2）时间差分：对存储的原始数据进行时间差分处理；（3）值排序：采用快速排序算法对时间差分处理后的数据进行值排序；（4）计算序号最大位数：计算出最大序号的最小二进制位；（5）生成序号压缩流：根据第（4）步计算出的序号最大位数，将序号写入缓存流中；（6）生成状态压缩流：通过分析状态数据的重复率来决定采用的压缩方案；目前的设置是，当有1/3的状态相同时，采用重复计数法进行压缩；否则，采用按位压缩法；重复计数法：在进行状态数据分析的同时，将生成一张二维表，记录了每一段重复状态的索引位置和重复数，压缩方案标志占1个位，表示后续压缩数据的压缩方案，在解压时会根据该标志来自动选择解压方案；重复次数使用第（4）步中计算的序号最大位数来存储；接下来的3个位存储状态值；按位压缩法：以3位为标准来存储状态值；（7）生成时差压缩流：通过分析时差数据的重复率来决定采用的压缩方案；目前的设置是，当有1/2的时差相同时，采用重复计数法进行压缩...

【技术特征摘要】
1.X-BIT压缩编码算法，其特征是具体压缩过程如下 (1)数据准备并转换数据在经过实时服务处理后，时间戳将转换成以秒为单位的UTC时间，每条记录用13个字节来存储原始数据； (2)时间差分对存储的原始数据进行时间差分处理； (3)值排序采用快速排序算法对时间差分处理后的数据进行值排序； (4)计算序号最大位数计算出最大序号的最小二进制位； (5)生成序号压缩流根据第(4)步计算出的序号最大位数，将序号写入缓存流中； (6)生成状态压缩流通过分析状态数据的重复率来决定采用的压缩方案；目前的设置是，当有1/3的状态相同时，采用重复计数法进行压缩；否则，采用按位压缩法；重复计数法在进行状态数据分析的同时，将生成一张二维表，记录了每一段重复状态的索引位置和重复数，压缩方案标志占I个位，表示后续压缩数据的压缩方案，在解压时会根据该标志来自动选择解压方案；重复次数使用第(4)步中计算的序号最大位数来存储；接下来的3个位存储状态值；按位压缩法以3位为标准来存储状态值； (7)生成时差压缩流通过分析时差数据的重复率来决定采用的压缩方案；目前的设置是，当有1/2的时差相同时，采用重复计数法进行压缩；否则，采用按位压缩法；重复计数法在对时差数据进行分析的同时，将生成一张二维表，记录了每一段重复时差的索引位置和重复数；时间的第一记录值保...

【专利技术属性】
技术研发人员：刘有志，唐新华，罗文理，李志金，谌志东，刘克勤，
申请(专利权)人：湖南大唐先一科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人