信息字的平均信息量编码设备和方法,平均信息量编码信息字的解码设备和方法技术

技术编号:3423554 阅读:130 留言:0更新日期:2012-04-11 18:40
进行平均信息量编码和相关解码的方法和设备利用一方面由具有可逆代码字的代码表(12)构成的,另一方面包括位于由所述代码表确定的区域(14)外的要编码信息字的换码区的代码。可以这样一种方式选择所述区域,以便根据代码表,用对称代码字对绝大部分信息字编码。一方面,除了正向解码外,还可进行反向解码(24),另一方面,可逆代码字的使用使得能够快速识别通过不理想的信道传送的代码字流中的错误。(*该技术在2019年保护过期,可自由使用*)

【技术实现步骤摘要】
,平均信息量编码信息字的解码设备和方法
本专利技术涉及平均信息量编码理论和相应的平均信息量编码信息字的解码理论。具体地说,本专利技术涉及音频信号的错误防范(error-safe)平均信息量编码和相应的解码。分别按照例如标准MPEG层3工作的现代音频编码和解码方法能够把音频信号的数据速率压缩到原量的例如十二分之一,而不会显著地降低音频信号的质量。为了获得这样高的数据简化,对音频信号采样,从而得到时间离散的一系列采样值。本领域中已知,借助适当的窗口函数,对该系列时间离散的采样值进行窗口截取,从而得到多组窗口截取时间采样值。随后,借助改进的离散余弦变换(MDCT)或另一适当装置,一组时间窗口截取采样值被变换为频域,以便获得在该频域中整个代表音频信号,即由该组时间离散采样值确定的时间窗口的频谱值。通常,借助MDCT,重叠50%的时间组被产生并被变换为频域,从而,由于MDCT的特殊性质的缘故,例如1024个时间离散采样值总是导致1024个频谱值。已知人耳的感受性依赖于音频信号自身的瞬时频谱。在所谓的心理声学模型中提到了这种依赖性,对于非常多的时间,借助该模型已能够根据瞬时频谱计算屏蔽门限值。屏蔽意味着例如,如果相邻的频谱区具有相当高的能量,则特定的声音或频谱分量被隐蔽。屏蔽事实被用于尽可能粗略地量化变换后存在的频谱值。于是,一方面需要尽力避免再次解码的音频信号中听得见的干扰,另一方面,需要尽可能地利用尽量少的二进制位对音频信号编码,或者说在量化音频信号的情况下,需要尽可能地利用尽量少的二进制位。量化引入的干扰,即量化噪声应低于屏蔽门限值,从而应是不可听见的。根据已知方法,把谱值分类为所谓的比例因子带,比例因子带被假定为对应于人耳的频率组。把一个谱值组内的谱值乘以一个比例因子,以便整体地按比例缩放一个比例因子带的谱值。随后量化乘以该比例因子的比例因子带,从而形成量化谱值。当然,分成比例因子带并不是决定性的。但是,在标准MPEG层3和标准MPEG-2 AAC(AAC=先进音频编码)中采用了它。数据简化的一个非常基本的方面在于量化后进行的量化谱值的平均信息量编码。对于平均信息量编码,通常采用霍夫曼编码。霍夫曼编码被认为是一种可变长度编码,即,用于要被编码值的代码字的长度取决于其出现概率。逻辑上,最可能的符号具有分配给它的最短代码,即,最短的代码字,从而借助霍夫曼编码,可实现很好的冗余缩减。众所周知的通用长度的编码技术的一个例子是Morse代码。在音频编码中,霍夫曼代码被用于对量化谱值编码。按照,例如标准MPEG-2 AAC工作的一种现代音频编码器按照特定的标准,把以分段方式分配给频谱的各个霍夫曼代码表用于对量化的谱值进行编码。在一个代码字中,通常总是存在2或4个谱值。根据MPEG-2 ACC的方法与根据MPEG层3的方法的差别在于不同的比例因子带,即不同的谱值被分成任意数目的频谱段。在AAC情况下,频谱段包括至少四个谱值,但是最好多于四个谱值。这样谱值的整个频率范围被分成相邻的区段,一个区段代表一个频带,从而所有区段一起构成由变换后的谱值覆盖的整个频率范围。为了得到最大的冗余缩减,如同MPEG层3方法中一样,把多个所谓的霍夫曼表中的一个霍夫曼表分配给一个区段。在通常具有1024个谱值的AAC方法的位流中,现在存在按频率升序排列的用于谱值的霍夫曼代码字。在辅助信息中传送关于每个频率区段中使用的霍夫曼表的信息。除了谱值外,就标准MPEG-2-AAC(ISO/IEC JTC1/SC29/WG11 IS13818.7)而论,还对比例因子进行霍夫曼编码,以便进一步降低要传送的二进制位的数量。为了进一步提高效率,对帧内的多个比例因子,即具有相关的变换为频域的窗口截取采样值块的帧内的比例因子进行差分编码。从起始值开始,通常无条件地从给定帧的第一个比例因子开始,确定差值。由于一个比例因子与下一比例因子之间的微小改变非常相似,因此对于压缩来说,这是特别有效的。使用的霍夫曼代码中的缺陷是它实质上不具有冗余。虽然出于节约二进制位及数据压缩的原因,这是绝对需要的,但是其结果是不存在任何可用冗余,通过这种可用冗余,可获得错误防范性。如果经过遭受错误的频道传送霍夫曼编码信号,则在发生错误之后,在解码器几乎不可能仍然“存有”可能的有效值。下面将借助霍夫曼编码比例因子,对此进行简要说明。如同已经提到的一样,霍夫曼代码是可变长度代码。这是霍夫曼代码的要点,意思是频繁产生的值具有分配给其的最短代码字,而产生频率较低的值具有分配给其的较长或很长代码字。按照所涉及的音频编码器的位流语法,霍夫曼代码字被连续写入帧的位流中。只有当正确地识别,即正确地译解相应的前代码时,也可确定比例因子的代码字的起点。这意味着,例如在一帧内存在40~100个比例因子,取决于已产生了多少比例因子带。这也意味着每个比例因子带,约40~100个比例因子经受霍夫曼编码。单个比例因子的代码按升序被连续写入位流中。如果经过遭受错误的频道,例如无线电频道的位流传送导致改变分配给头一个比例因子的代码字的长度的位错误,则由于解码器不可能确定第二个比例因子的代码字的起点,因此不可能以无错误的方式译解整帧的比例因子。这样,虽然除了位于起点处的比例因子之外,所有其它比例因子均被正确传送(在例子中,位于起点处的比例因子受到了干扰),编码器也不可能译解正确传送的比例因子。美国专利No.5488616A涉及一种提供可逆的可变长度代码的系统。为此,由仅仅临时产生的不可逆的可变长度代码产生非对称的可逆代码。不可逆的可变长度代码进一步被转换为对称的可逆代码。选择装置或者选择非对称的可逆代码作为输出信号,或者选择对称的可逆代码作为输出信号。对称的可逆代码用完整的代码树表示,在该代码树中,所有的分支或者由对称代码字终止,或者由分支点终止,这些分支点又被对称代码字终止,或者产生更多的分支点。这样,代码树排他地含有有效的,即对称的代码字。Goran Bang和Goran Roth为1996年7月的ISO/IEC JTC1/SC29/WG11提出的技术性出版物“用于产生误比特回复VLC表的工具”涉及利用可变长度代码(VLC)对视频信息和音频信息编码和解码的构思,它适于和对错误敏感的信道一起使用。如果沿接收位流的正向方向检测到位错误,则沿相反方向进行解码。如果在相反方向解码过程中也检测到位错误,则终止沿相反方向的解码。采用的代码是非对称的固定长度代码,其中混合有对称的可变长度代码,以致特定数目二进制位的固定长度代码字之后跟随一个二进制位的对称的可变长度代码字。对称的可变长度代码字仅仅用于提供错误防范性,并不携带有用信息。在接收器机,首先抽取对称的可变长度代码字,并且就传输错误,分析该对称的可变长度代码字。这种混合代码的缺陷在于由于只检查对称的可变长度代码字,因此不能确定在固定长度代码字中产生的错误。另一方面,如果相关的可变长度代码字含有干扰,则无干扰的固定长度代码字可被确定为遭受错误的代码字。本专利技术的目的是实现信息字的平均信息量编码及对平均信息量编码信息字的解码的构思,在经过遭受错误的信道传送平均信息量编码信息字的情况下,它可改进错误识别。该专利技术目的是通过根据权利要求1或36所述的平均信息量编码设备,根据权利要本文档来自技高网...

【技术保护点】
一种信息字的平均信息量编码设备,包括: 从一组可逆代码字中把一个可逆代码字分配给位于信息字区域中的一个信息字的装置(12),该组可逆代码字被设计成对于该区域中的每个信息字,都提供了一个特定的可逆代码字;及 为位于信息字区域外的信息字产生附加值(33,34)的装置(14)。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:马丁迪耶茨阿里诺巴克特伊拉尼拉尔夫斯帕施内德尔奥利弗昆茨
申请(专利权)人:弗兰霍菲尔运输应用研究公司
类型:发明
国别省市:DE[德国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1