数字音频信号的分级编码制造技术

技术编号:5392306 阅读:171 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种用于对数字音频信号(S)的采样进行基于标量量化的编码的方法,在预定数目的比特上编码所述采样、以便获得量化索引(IPCM)的二进制帧。使用幅度压缩律来编码所述采样,并且在量化索引的二进制帧中没有考虑预定数目的最低有效位。所述编码方法包括以下步骤:保存(27)在量化索引的二进制帧中没有考虑的最低有效位的至少一部分;以及确定(28)包含至少一个保存的比特的增强流(IEXT)。本发明专利技术还涉及一种相关联的解码方法,所述解码方法包括以下步骤:接收(29)包含一个或多个扩展比特的增强流(I′EXT);以及在源自二进制帧的比特之后级联(30)扩展比特,以便获得解码的音频信号。本发明专利技术还涉及用于进行所述方法的编码器和解码器。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种用于音频数据的分级编码的方法,更具体地,涉及一种用于基于 标量量化(scalar qimntization-based)的编码的方法。 特别地设计该编码,以用于传送和/或用于存储诸如音频频率信号(语音、音乐或 其他)之类的数字信号。 本专利技术更具体地涉及波形的编码,诸如其中在没有预测的情况下、单独地对每个 输入采样进行编码的PCM(代表"脉冲编码调制")编码。
技术介绍
诸如参考图1来描述由推荐标准UIT-T G. 711规定的PCM编码/解码的一般原理。 将输入信号假设为被定义有的最小带宽并且利用每个采样16个比特的分辨 率而以8kHz (按照已知为"线性PCM"的格式)来进行采样。 PCM编码器13包括在其输入处接收输入信号S的量化模块QpcM 10。经由传送信 道11来向解码器14传送在量化模块10的输出处的量化索引IrcM。 解码器PCM 14在其输入处接收来自传送信道的索引I' pcM(IpcM的可受到二进 制误差影响的版本),并且通过逆量化模块Q—12来进行逆量化,以便获得编码的信号S Mic0 规范化的UIT-T G. 711 PCM编码(在下文中,称为G. 711)在均匀标量量化以前、利用对数曲线来对信号的幅度进行压縮,这允许了对于宽动态范围的信号来获得近似恒定的信噪比。因此,原始信号的频率范围中的量化步长与信号的幅度成比例。 在8个比特或256个电平上量化已压縮信号的连续采样。在公共交换电话网(PSTN)中,以8kHz的频率来传送这8个比特,给出了 64kbits/s的比特率。 根据G. 711标准的量化的信号帧包括在8个比特上编码的量化索引。因而,如果通过表格来应用逆量化,则其简单地由指向256个可能解码值之一的索引组成。 因为实现的复杂度,所以已经通过分段的线性曲线来近似PCM压縮。 在G. 711标准中定义了两个编码律(coding law):律A,主要用在欧洲;以及mu(iO律,用在北美和日本。 这些编码律允许将幅度压縮(或"压縮扩展")应用于信号。信号的幅度因而利用 编码器中的非线性函数来进行"压縮",在传送信道上发送,并且利用解码器中的反函数来 进行"解压縮"。幅度压縮的优点在于,其允许将输入音频信号的幅度的概率分布变换为准 均匀概率律,在所述准均匀概率律上可以应用均匀标量量化。 幅度压縮律一般是对数类型的律,所述对数类型的律因此允许在8个比特上(按 照律A或mu类型的"PCM"格式)对利用16个比特分辨率(按照"线性PCM格式")来采样 的信号进行编码。 按照诸如在图1中的附图标记15处示出的以下方式来分配G.711中的每个采样 的8个比特 -l个符号位S(O代表负值,否则为l),被分派了图1中的附图标记sgn, -用于指示片段(图1中的附图标记ID-SEG)的3个比特,对于A律来说,通过 256*2n来给出每个片段的结尾;而对于mu律来说,通过256*2n_132来给出每个片段的结 尾,其中n二0,1,...,7。因此,当转到较高的片段(对于A律来说,从第2片段开始)时, 量化步长乘以2。-用于指示片段上的位置的4个比特,被分派了图1中的附图标记ID-POS。 最后7个比特因此构成了编码后的绝对值。以下,我们将首先研究律A的情况,然 后对于mu律来推广所述结果。根据A律G. 711标准,通过对从最低有效位或LSB开始的每 个第二比特进行取反来获得最终索引。该编码律允许最初两个片段上的12个比特的标量 量化精确度(因此,16的量化步长),然后当片段数目增加1时,精确度降低1比特。 可注意到的是,可能通过在要编码的采样的幅度与量化器的判决阈值之间进 行简单比较,来执行从在16个比特上表示的数字信号开始的G. 711PCM量化。二分法 (dichotomy)的使用使这些比较显著加速。该解决方案需要存储具有256个条目的表格; 在下文中,表格1表现了来自用于G. 711律A的这样的表格的摘录。 <table>table see original document page 4</column></row><table><table>table see original document page 5</column></row><table> 表格l.用于通过二分法来进行搜索的阈值 例如,要编码的信号S的原始采样具有等于-75的幅度。结果,该幅度包括在该表 格的行123(或"电平"123)的区间(interval) 中。该信息的编码在于传递编码 后的最终索引,其在图1被标记为I'Mi。以及在表格1中等于0x51。在解码时,逆量化操作 因此在于恢复索引I'Mi。 = 0x51,并且在于使得量化后的值VQ(诸如,VQ = -72)与之对应。 结果,所述解码将该值-72分派到解码后的信号S' Mi。的对应采样的幅度。将提及的是,该 相同值VQ = _72将被分派到要解码并且其初始幅度具有区间中的值(为该区 间内的总共16个可能值)的所有采样,这对应于这里为16的量化步长。 另一方面,将注意的是,相同值VQ = 32256将被分派到其初始幅度在区间中(其为总共1024个可能值)的所有采样,这对应于1024的量化步长。 通过PCM编码所获得的信噪比(SNR)对于宽动态范围的信号来说或多或少是恒定 的( 38dB)。原始信号的频率范围中的量化步长与信号的幅度成比例。该信噪比不足以 使得量化噪声在频率0-4000Hz的整个波段上听不见。而且,对于(利用第一片段来编码 的)低电平信号来说,SNR非常差。 —般地,认为G. 711标准对于在将波段限制到的终端上的窄带电话 应用来说具有良好的质量。然而,当将G.711用于其他应用(诸如,用于波段 中的高保真度终端或用于G. 711编码的宽带分级扩展)时,该质量不够高。 为此,确实存在分级编码的方法,所述方法在于生成根据G. 711编码器的编码噪 声来确定的增强层。然后,该编码噪声通过与G.711不同的技术来编码,这形成了已知为 "基础层"(或"核心层")的层。例如,在以下文献中描述了这种分级编码方法Y.Hiwasaki、 H. 0hmuro、 T. Mori、 S. Kurihara禾口 A Kataoka的〃 A G. 711 embedded wideband speech coding for VoIPconferences (用于VoIP会议的G. 711嵌入式宽带语音编码)",IEICE Trans. Inf.& Syst, Vol. E89_D, n 9,2006年9月。这类方法具有以下缺点,即非常显著地 增加了编码器的复杂度,然而PCM类型的编码被公认为具有低复杂度。而且,由于PCM编码 噪声是白噪声、因此是非相关的,所以这类噪声的编码难以实现,这是因为压縮技术实质上 基于来自要编码信号的相关性的提取属性。
技术实现思路
本专利技术提供了一种改善该情形的解决方案。 为了该目的,本专利技术提供了一种用于对数字音频信号的采样进行基于标量量化的 编码的方法,在预定数目的比特上编码所述采样、以便获得量化索引的二本文档来自技高网
...

【技术保护点】
一种用于对数字音频信号(S)的采样进行基于标量量化的编码的方法,在预定数目的比特上编码所述采样、以便获得量化索引(I↓[PCM])的二进制帧,根据幅度压缩律来进行所述编码,其中在量化索引的二进制帧中没有考虑预定数目的最低有效位,其特征在于,所述方法包括以下步骤:-存储(27)在量化索引二进制帧中没有考虑的最低有效位的至少一部分;-确定(28)包括至少一个如此存储的比特的增强比特流(I↓[EXT])。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:巴拉茨科维西斯蒂法尼拉戈特
申请(专利权)人:法国电信公司
类型:发明
国别省市:FR[法国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1