The embodiment of the invention provides a data processing method, the method comprises: acquiring the encoding characters, according to the static statistical model, partition the space to the corresponding character encoding encoding, in order to obtain the next to the initial encoding space corresponding to the character encoding; next to encoding characters as current encoding characters. According to the statistical model for the character, partition the space to the corresponding character encoding encoding, in order to obtain the next to the initial encoding space corresponding to the character encoding, character encoding data until all encoding is completed, according to the first results obtained encoding; coefficient of different characters to encoding data in frequency calculation, encoding the cumulative frequency coefficient of each symbol and the initial encoding space size; the coefficient of the encoding, the encoding and encoding results Data length is encoded output. The method further improves the compression ratio of the data, and makes the compression effect better.
【技术实现步骤摘要】
数据处理方法
本专利技术涉及数据处理领域,具体而言,涉及无损数据处理方法。
技术介绍
当前区间编码以及算术编码虽然能对数据进行一定程度的压缩,但是其压缩率并不高。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提供无损数据处理方法,以解决上述问题。第一方面,本专利技术实施例提供的一种数据处理方法,所述方法包括:对初始编码空间进行空间扩展得到扩展后的空间,根据所述字符的静态统计模型,对扩展后的初始编码空间进行划分,以获得当前待编码字符对应的编码空间;对所述当前编码字符对应的编码空间进行扩展,得到扩展后的编码空间;根据所述字符的统计模型,对所述扩展后的编码空间进行划分,以获得下一待编码字符对应的编码空间;将下一待编码字符作为当前待编码字符,直到所述待编码数据中字符全部编码完毕,获得编码结果;将所述编码结果、待编码数据长度以及第一统计参数作为编码输出,所述第一统计参数为所述待编码数据中包含1的个数。第二方面,本专利技术实施例提供的一种数据处理方法,所述方法包括:获取编码输出,所述编码输出包括编码结果、待编码数据长度以及第一统计参数,所述第一统计参数为所述待编码数据中包含1的个数;根据初始解码空间的大小、所述各个符号的累积频度、第二统计参数以及第一系数获得当前解码空间,所述第二统计参数为待编码数据中包含字符种类的个数,所述第一系数为常数或者根据函数关系式计算的函数值,所述符号的累积频度是指符号值小于所述符号的值的其它符号的频度之和;根据第一统计参数、待编码数据长度、根据第一系数的增量函数关系得到解码阈值;将所述编码结果与所述解码阈值进行比较,得到解码输出;更新当前 ...
【技术保护点】
一种数据处理方法,其特征在于,所述方法包括:对初始编码空间进行空间扩展得到扩展后的空间,根据所述字符的静态统计模型,对扩展后的初始编码空间进行划分,以获得当前待编码字符对应的编码空间;对所述当前编码字符对应的编码空间进行扩展,得到扩展后的编码空间;根据所述字符的统计模型,对所述扩展后的编码空间进行划分,以获得下一待编码字符对应的编码空间;将下一待编码字符作为当前待编码字符,直到所述待编码数据中字符全部编码完毕,获得编码结果;将所述编码结果、待编码数据长度以及第一统计参数作为编码输出,所述第一统计参数为所述待编码数据中包含1的个数。
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:对初始编码空间进行空间扩展得到扩展后的空间,根据所述字符的静态统计模型,对扩展后的初始编码空间进行划分,以获得当前待编码字符对应的编码空间;对所述当前编码字符对应的编码空间进行扩展,得到扩展后的编码空间;根据所述字符的统计模型,对所述扩展后的编码空间进行划分,以获得下一待编码字符对应的编码空间;将下一待编码字符作为当前待编码字符,直到所述待编码数据中字符全部编码完毕,获得编码结果;将所述编码结果、待编码数据长度以及第一统计参数作为编码输出,所述第一统计参数为所述待编码数据中包含1的个数。2.根据权利要求1所述的方法,其特征在于,所述静态统计模型为所述待编码数据中各个字符出现的频度的统计模型。3.根据权利要求1所述的方法,其特征在于,所述直到所述待编码数据中字符全部编码完毕获得编码结果,包括:当所述待编码数据中最后一个字符编码完成后,将所述最后一个字符对应的编码空间的下限作为编码结果。4.根据权利要求1所述的方法,其特征在于,所述对所述当前编码字符对应的编码空间进行扩展,得到扩展后的编码空间,包括:根据所述当前编码字符对应的编码空间的空间大小以及第一系数,得到扩展后的编码空间的空间大小;根据所述初始编码空间的区间大小、所述各个符号的累积频度、第二统计参数以及第一系数,获得所述扩展后的编码空间的下限值,所述第二统计参数为待编码数据中包含字符种类的个数,所述符号的累积频度是指符号值小于所述符号的值的其它符号的频度之和;根据所述扩展后的编码空间的下限以及所述扩展后的编码空间的区间大小,得的所述扩展后的编码空间的上限。5.根据权利要求1所述的方法,其特征在于,所述对所述当前编码字符对应的编码空间进行扩展,得到扩展后的编码空间,包括:根据所述初始编码空间的区间大小、所述各个符号的累积频度、第二统计参数以及第一系数,获得所述扩展后的编码空间的下限值以及上限值,所述第二统计参数为待编码数据中包含字...
【专利技术属性】
技术研发人员:王杰林,
申请(专利权)人:湖南千年华光软件开发有限公司,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。