一种基于SLWE概率估计模型的自适应区间编码方法及解码方法技术

技术编号:11955865 阅读:191 留言:0更新日期:2015-08-27 07:53
一种基于SLWE概率估计模型的自适应区间编码方法及解码方法,涉及利用随机学习弱估计理论(SLWE)进行信源概率估计的自适应区间编码及解码技术。它是为了解决现有的区间编码在信源特性不断改变的环境下编码性能降低的问题。本发明专利技术主要有两点创新:一是在区间编码中利用SLWE的思想设计信源概率估计模型,并通过设置区间的下限避免区间退化的情况发生,同时提高了编码效率;二是在整个编解码实现过程中用区间更新取代概率更新,避免了浮点相加运算的舍入影响。本发明专利技术实现的区间编码方法适合于信源特性非平稳环境下的编码,相比于传统的基于最大似然思想进行概率估计的区间编码方法,编码性能提升了2%到10%。

【技术实现步骤摘要】

本专利技术涉及利用随机学习弱估计理论(SLWE)进行信源概率估计的自适应区间编 码及解码技术。
技术介绍
随着信息产业和多媒体技术的蓬勃发展,每天产生的数据量越来越巨大,为了节 省存储空间和传输带宽,迫切需要各种数据压缩技术的发展。熵编码属于数据压缩技术中 的一种,也是很多国际压缩标准中的关键一环,在数据压缩领域占有重要的地位。其理论基 础为香农的信息论,主要通过去除数据中的统计冗余达到压缩数据的目的,可压缩到的理 论极限为待压缩数据的香农熵。目前常见的熵编码方法有Huffman编码、算术编码、区间编 码等,其中算术编码和区间编码由于可以用小数位比特编码每个字符,因而编码性能更高, 二者中又因为区间编码不受专利的限制,因而吸引了越来越多的人对其进行研宄。 除了编码速度、存储空间等工程实现方面的因素以外,理论上影响熵编码性能的 关键在于编码过程中编码器对信源概率特性的估计与信源的实际情况是否一致,当估计值 与真实情况完全一致时,理论上能达到该信源的压缩极限,即香农熵值,熵编码器中主要依 靠概率估计模型对信源进行概率估计。对于区间编码来说,依照概率估计过程中需要事先 遍历全部待压缩数据或仅依靠已经编码完的数据,可分为静态区间编码和自适应区间编 码,其中自适应模式由于不需要事先遍历数据,因而应用范围更广。现阶段的自适应区间编 码主要利用基于最大似然的参数估计思想,即以累积频率逼近概率的方式对信源特性进行 估计,当信源特性发生变化时,其估计效果较差,影响最终的编码性能,其根本原因是最大 似然参数估计法属于强估计方法,算法收敛之后很难再随环境改变。近年来,一大类弱估计 算法的涌现为这一问题的解决提供了新的思路,其中较具有代表性的一种弱估计算法为随 机学习弱估计法(SLWE),它能有效地解决非平稳环境下二项分布和多项分布的参数估计问 题,并且估计方式简单,易于实现。
技术实现思路
本专利技术是为了解决现有的区间编码在信源特性不断改变的环境下编码性能降低 的问题,从而提出一种基于SLWE概率估计模型的自适应区间编码方法及解码方法。 一种基于SLWE概率估计模型的自适应区间编码方法,步骤一、统计信源的基本信息,所述基本信息包括:待编码数据长度BSIZE、符号 最大值ma、符号最小值mi、符号种类数N,所述各符号的种类分别用索引0,…,N-1表示; 步骤二、初始化区间上界Rini和区间下界Lini,初始化各个符号占据的初始区间长 度range,. ..,range,以数组形式保存,初始化区间规格化时的临界阈值Range。;步骤三、根据读入字符计算累积区间长度:初始化原始累积区间长度Cumrange为 0,根据当前待编码字符索引j,计算累积区间长度Cumrange; 步骤四、编码和区间规格化:根据当前待编码字符种类的索引对原始累积区间进 行更新,当更新后的累积区间长度小于临界阈值Rangejt,或以字节为单位比较更新后的 累积区间的上界和下界,当上界和下界的高位字节相等时,移出高位的字节作为输出码流, 同时对区间进行规格化处理;并计算编码后区间和编码前区间的比值m; 步骤五、更新概率估计表;根据SLWE算法对各字符所在区间的大小进行更新,具 体过程如下: 步骤五一、根据信源基本信息,设置最小概率Pmin,并根据当前总区间大小Range 计算各字符所在区间的下限Rmin=Range,初始化学习因子A,定义变量Sum_range= 〇 ; 步骤五二、根据公式:range -max(range ?m?入,Rmin)依次计算序号为i=0,. . .,N-l且i辛j的字符所占累积区间的大小; 步骤五三、根据公式:【主权项】1. 一种基于SLWE概率估计模型的自适应区间编码方法,其特征是: 步骤一、统计信源的基本信息,所述基本信息包括:待编码数据长度BSIZE、符号最大 值ma、符号最小值mi、符号种类数N,所述各符号的种类分别用索引0,…,N-I表示; 步骤二、初始化区间上界Rini和区间下界L ini,初始化各个符号占据的初始区间长度 range,. . .,range,以数组形式保存,初始化区间规格化时的临界阈值Range。; 步骤三、根据读入字符计算累积区间长度:初始化原始累积区间长度Cumrange为0,根 据当前待编码字符索引j,计算累积区间长度Cumrange ; 步骤四、编码和区间规格化:根据当前待编码字符种类的索引对原始累积区间进行更 新,当更新后的累积区间长度小于临界阈值RangeJt,或以字节为单位比较更新后的累积 区间的上界和下界,当上界和下界的高位字节相等时,移出高位的字节作为输出码流,同时 对区间进行规格化处理;并计算编码后区间和编码前区间的比值m ; 步骤五、更新概率估计表;根据SLWE算法对各字符所在区间的大小进行更新,具体过 程如下: 步骤五一、根据信源基本信息,设置最小概率Pmin,并根据当前总区间大小Range计算 各字符所在区间的下限Rmin= Range · pmin,初始化学习因子λ,定义变量Sum_range = 0 ; 步骤五二、根据公式: range 一 max (range · m · λ,Rmin) 依次计算序号为i = 〇,...,N-I且i辛j的字符所占累积区间的大小; 步骤五三、根据公式:计算除了序号j的剩余字符所占区间的和; 步骤五四、根据公式: range 一 Range_Sum_range 更新序号j字符所占的区间; 步骤六、根据步骤三至五的方式,对所有待编码数据进行编码;当已编码字符数量等于 待编码数据长度BSIZE时,则编码结束,并移出映射区间内所有的位。2. -种基于SLWE概率估计模型的自适应区间解码方法,其特征是: 步骤A1、读取信源基本信息文件,得到原数据长度BSIZE、符号最大值ma、符号最小值 mi和符号种类数N ; 步骤A2、初始化区间上界Rini和区间下界Lini,初始化各个符号占据的初始区间长度 range ,. . .,range ,以数组形式保存,初始化区间规格化时的临界阈值Range。;以 字节为单位读取码流文件,得到初始标识符tag ; 步骤A3、根据初始标识符tag和当前区间下界L以及各符号的区间长度进行解码,解码 过程中得到当前符号的索引j ; 步骤A4、根据当前符号的索引j更新原始区间,当更新后区间长度小于临界阈值 RangeJt,或以字节为单位比较更新后的区间的上界和下界,当上界和下界的高位字节相 等时,移出码流文件中高位的字节作为新的标识符,同时对区间进行规格化处理;并计算解 码后区间和解码前区间的比值m ; 步骤A5、更新概率估计表;根据SLWE算法对各字符所在区间大小进行更新,具体过程 如下: 步骤A51、根据信源基本信息,设置最小概率pmin,并根据当前总区间大小Range计算各 字符所在区间的下限Rmin= Range · pmin,初始化学习因子λ,定义变量Sum_range = O ; 步骤A52、根据公式: range 一 max (range · m · λ,Rmin) 依次计算序号为η = 0,. . .,Ν-1,η辛j且i辛j的字符所占区间的大小; 本文档来自技高网
...
一种基于SLWE概率估计模型的自适应区间编码方法及解码方法

【技术保护点】
一种基于SLWE概率估计模型的自适应区间编码方法,其特征是:步骤一、统计信源的基本信息,所述基本信息包括:待编码数据长度BSIZE、符号最大值ma、符号最小值mi、符号种类数N,所述各符号的种类分别用索引0,…,N‑1表示;步骤二、初始化区间上界Rini和区间下界Lini,初始化各个符号占据的初始区间长度range[0],...,range[N‑1],以数组形式保存,初始化区间规格化时的临界阈值Range0;步骤三、根据读入字符计算累积区间长度:初始化原始累积区间长度Cumrange为0,根据当前待编码字符索引j,计算累积区间长度Cumrange;步骤四、编码和区间规格化:根据当前待编码字符种类的索引对原始累积区间进行更新,当更新后的累积区间长度小于临界阈值Range0时,或以字节为单位比较更新后的累积区间的上界和下界,当上界和下界的高位字节相等时,移出高位的字节作为输出码流,同时对区间进行规格化处理;并计算编码后区间和编码前区间的比值m;步骤五、更新概率估计表;根据SLWE算法对各字符所在区间的大小进行更新,具体过程如下:步骤五一、根据信源基本信息,设置最小概率pmin,并根据当前总区间大小Range计算各字符所在区间的下限Rmin=Range·pmin,初始化学习因子λ,定义变量Sum_range=0;步骤五二、根据公式:range[i]←max(range[i]·m·λ,Rmin)依次计算序号为i=0,...,N‑1且i≠j的字符所占累积区间的大小;步骤五三、根据公式:Sum_range=Σi=0N-1i≠jrange[i]]]>计算除了序号j的剩余字符所占区间的和;步骤五四、根据公式:range[j]←Range‑Sum_range更新序号j字符所占的区间;步骤六、根据步骤三至五的方式,对所有待编码数据进行编码;当已编码字符数量等于待编码数据长度BSIZE时,则编码结束,并移出映射区间内所有的位。...

【技术特征摘要】

【专利技术属性】
技术研发人员:陈浩刘东滑艺
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:黑龙江;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1