一种基于算术编码的无损数据压缩编码方法技术

技术编号:15034985 阅读:62 留言:0更新日期:2017-04-05 10:05
一种基于算术编码的无损数据压缩编码方法,包括以下过程:1)编码:假设n个源符号的概率分布为{0<p1<=p2<=...<=pn<1},是按照下标进行单调增序排列,给n个符号配上符号标号为{n‑1,n‑2,......,1,0},概率为pi的符号配上标号为n‑i,i=1,2,...,n,假设输入的长度为K字符串J1J2J3......Jn‑1JK,其中Ji∈{0,1,2,...,n‑1},那么定义该字符串对应于单位区间[0,1]内的有理数τ,将τ看作是十进制数,在数学上证明它是属于[0,1]单位区间的,将其转换成二进制表示,表示结果的二进制序列即为编码的输出比特流;2)解码:将所述比特流转成十进制有理数对应在单位区间[0,1]内的有理数。本发明专利技术不需要除法,且是熵最优码,不依赖分组扩展模式,使用方式灵活。

【技术实现步骤摘要】

本专利技术属于数据压缩领域,涉及一种无损数据压缩编码方法。
技术介绍
算术编码是一种非常经典而知名的无损数据压缩编码方法。数据压缩技术在信息技术中具有极其重要的地位,数据压缩方法又分为有损压缩和无损压缩。有损压缩方法一般基于人类感知器官(听觉系统、视觉系统)的特性,删除大量感知冗余数据,但又不影响人们的收听和收视的感知质量。例如,音频MP3技术利用了人类听觉系统的时域或频域屏蔽特性和听阈特性;而视频MPEG编码技术充分利用了人眼帧采样频率的特性对图像帧间运动估计作出有效补偿,从而删除大量的帧间冗余信息达到数据压缩的效果。无损压缩技术通常用于计算机文档、医学图像的数据压缩中,在那里数据是需要严格无损耗恢复的。此外,无损压缩技术还可以作为有损压缩技术系统的后端,对输入的有损压缩数据流作进一步的无损压缩,如图1所示。在无损压缩技术中Huffman编码是广泛使用的熵编码算法,相对于算术编码方法来说,其最大的问题是基于分组扩展模式来对字符串流进行编码处理,随着分组宽度的增加,其编码冗余度降低,因而逼近熵最优。但是由于分组宽度增加带来了字符表设计的复杂度的增加,且在实际应用中分组宽度固定的可扩展性、灵活度较差,实际上而逊于算术编码。算术编码是自然的流式编码,其没有分组扩展的概念,任意长短的输入字符串流皆可映射到一个[0,1]单位区间的有理数(或互不相交的区间段),适用性、灵活性都较Huffman编码高,且基于对字符源的概率分布的准确估计,算术编码也是熵最优编码,字符源的概率分布估计越精确,算术编码的冗余度越低、从而越接近熵最优。正因为算术编码的优势,导致它在技术上被研究得最充分,被授权的相关的专利也最多,虽然很多专利在上个世纪90年代失效了,但是近年来又有很多算术编码相关的专利被申请、并得到授权。反过来,由于算术编码被广泛地授权专利,所以反而给Huffman编码留出了很多工业应用的空间。经典的算术编码的思想是将输入字符串流映射到[0,1]区间的一个有理数(十进制形式),再将这个数使用二进制表示成比特流,该比特流就是编码结果;解码过程将比特流转成[0,1]区间的十进制小数,通过符号源的概率分布,从首至尾逐个解出字符。具体编码过程如下,设符号源为{1,2,3,......,n本文档来自技高网...

【技术保护点】
一种基于算术编码的无损数据压缩编码方法,其特征在于:所述编码方法包括以下过程:1)编码:假设n个源符号的概率分布为{0<p1<=p2<=...<=pn<1},是按照下标进行单调增序排列,给n个符号配上符号标号为{n‑1,n‑2,......,1,0},概率为pi的符号配上标号为n‑i,i=1,2,...,n,假设输入的长度为K字符串其中Ji∈{0,1,2,...,n‑1},那么定义该字符串对应于单位区间[0,1]内的有理数τ;τ=Σi=1KJipin-Ji]]>将τ看作是十进制数,在数学上证明它是属于[0,1]单位区间的,将其转换成二进制表示,表示结果的二进制序列即为编码的输出比特流;2)解码:将所述比特流转成十进制有理数对应在单位区间[0,1]内的有理数,设为τ,令L=1,τ1=τ以下分三个步骤解码:2.1)在集合中找出满足τL>=kpLn‑k的最大的k,记为k*;2.2)JL=k*;2.3)如L<K,则并令L=L+1,回到步骤2.1),否则结束。

【技术特征摘要】
1.一种基于算术编码的无损数据压缩编码方法,其特征在于:所述编码方法包括以下过...

【专利技术属性】
技术研发人员:陆成刚
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1