在音频编码/解码中用于知觉加权的设备制造技术

技术编号:3048367 阅读:177 留言:0更新日期:2012-04-11 18:40
一种用于在划分成相邻的第一和第二子带的频带中使用的分级音频编码器,所述编码器包括:用于编码在所述频带的第一子带中的原始信号的核心编码器(305);用于从所述原始信号和来自所述核心编码器的信号中计算残差信号(e)的级(306);用于对所述残差信号(e)进行知觉加权的设备。根据本发明专利技术,所述知觉加权设备包括具有增益补偿的知觉加权滤波器(307),其被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和在第二子带中的信号之间的频谱的连续性。应用于传输和存储诸如音频语音、音乐等信号之类的数字信号。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种用于在给定频带中编码/解码音频信号的知觉加4又i殳备(perceptual weighting device )。也涉及包括本专利技术的编码/解码设备的分级音 频编码器和分级音频解码器。本专利技术在传输和存储诸如音频语音、音乐等信号之类的数字信号方面具 有特别有利的应用。
技术介绍
存在用于数字化和压缩音频语音、音乐等信号的各种技术。最常用的方 法是 i者如PCM和ADPCM编码的波形编码方法; 参数分析/合成编码方法,诸如码本激励线性预测(CELP)编码; 子带或变换知觉(perceptual)编码,,方法。在编者W.B. Kleijn和K.K. Paliwal的Speech Coding and Synthesis, Elsevier,1995 —书中描述了这些用于编码音频-频率信号的传统技术。在这里,本专利技术更具体地关注包括CELP编码和变换编码:忮术的预测变 换编码方法。在传统语音编码中,编码器按照固定的比特率产生比特流。这种固定的 比特率对简化的实现和通常被组合地称为编解码器的编码器和解码器的 使用方面存在限制。这样的系统的示例是64千比特每秒(kbps)的ITU-T G.711 编码系统、8kbps的UIT-T G.729编码系统和12.2kbps的GSM-EFR编码系统。然而,在诸如移动电话、IP话音、以及专用(adhoc)网络上的通信之 类的某些应用中,其优选按照可变比特率产生比特流,具有由预定义的集合 中取得的比特率。许多比固定比特率编码更灵活的多比特率编码技术因此能 够4皮区分为 源和/或信道控制的多模编码,如用于AMR-NB 、 AMR-WB 、 SMV、 和VMR-WB系统;-分级编码,也叫作分层(scalable ),,编码,其产生分级的比特流, 在此意义上,其包括核心比特率和一个或多个增强层。在48kbps、 56kbps 和64kbps的G.722系统是比特率分层编码的简单示例。MPEG-4 CELP编解 码器是在比特率和带宽中的分层;此类编解码器的其它示例能够在以下论文 中找到B. Kovesi、 D. Massaloux、 A. Sollaud的A Scalable Speech and Audio Coding Scheme with Continuous Bitrate Flexibility , ICASSP 2004; 多描述编码。本专利技术更具体地涉及分级编码。分级或分层音频编码的基本和无念在例如以下i仑文中i兌明Y. Hiwasaki、 T, Mori、 H. Ohmuro、 J. Ikedo、 D. Tokumoto以及A. Kataoka的Scalable Speech Coding Technology for High-Quality Ubiquitous Communications, NTT Technical Review, 2004年3月。在此类型的编码中,比特流包括基本层或核心层,以及一个或多个增强 层。基本层由已知为核心编解码器的编解码器按低的固定比特率产生, 所述低的固定比特率保证编码质量的某最小级别并且必须被解码器接收以便 维持可接受级别的质量。增强层被用来增强质量;它们将不会全部被解码器接收。分级编码的主 要好处是能够简单通过截断该比特流来适配比特率。层的可能数量(即,比 特流截断的可能数量)定义编码颗粒度在强颗粒度编码中比特流包括较少 的层(达到2 - 4层),同时精细颗粒度编码提供达例如1 kbps级的增量。本专利技术更具体涉及使用电话带中的CELP类型的核心编码器和一个或多 个宽带增强层的比特率和带宽分层编码技术。该系统的示例在以下论文中给 出H. Tadd6i等人的A Scalable Three Bitrate (8 , 14.2, and 24 kbps) Audio Coder, 107th Convention AES, 1999, 具有8 kbps、 14.2 kbps、和24 kbps 的粗糙颗粒度;并且在B. Kovesi等人的前述论文中参考6.4 kbps到32 kbps 的精细颗粒度。在2004, ITU-T启动了标准化分级核心编码器的项目。该G.729EV编码 器(EV表示嵌入的可变比特率,,)是已知的G.729编码器的补充。G.729EV 标准的目标是获得G.729核心分级编码器,G.729核心分级编码器为对话服务 产生在8 kbps到32 kbps的比特率的具有从窄带(300赫兹(Hz )到3400 Hz) 到宽带(50Hz到7000Hz)扩展的频带的信号。该编码器固有地能够与G.729建议(recommendation)互通,这确保了与现有IP话音装备的兼容性。图1所示的8 kbps到32 kbps分级音频编码器^皮提出以响应以上项目并 在以下ITU-T文档中描述ITU-T document COM 16, D135 (WP 3/16), France Telecom G.729EV Candidate: High level description and complexity evaluation, Q.10/16, 2005-2008研究期,日内瓦,2005年7月26日-8 月5日。该编码器实现三层编码,包括级联CELP编码、通过全频带线性预 测编码(LPC)的频带扩展和预测变换编码。在施加改进离散余弦变换 (MDCT)之后施加TDAC (时域声音混叠(aliasing)消除)编码。预测变 换编码层使用全频带知觉加权滤波器,ra。在前述的W.B.Kleijn等人的出版物中解释了通过知觉加权滤波修整编 码噪声的概念。本质上,知觉加权滤波通过削弱噪声密度高且噪声更容易被 屏蔽的频率处的信号来修整该编码噪声。在窄带CELP编码中最广泛地使用的知觉加权滤波器具有^V)^/^k/};2」 的形式,其中,0^};2^力<1并且i(^)表示具有5毫秒(ms)到30ms长度 的信号段的LPC频谱。因此在CELP编码中的合成分析等于(amounts to )在 由该类型的滤波器知觉加权的信号域中最小化二次误差。然而,在G.729EV标准的情况下提出的该技术具有使用全频带知觉加权 滤波器的缺点。该关联的滤波器就计算时间而言相对复杂。因此要由本专利技术的主题解决的技术问题是提出 一种用于在给定频带中编 码/解码音频信号的知觉加权设备,其提供全频带知觉加权滤波,即,在所述 给定频带的整个之上,尤其在分级音频编码器的0到8000Hz的宽带上,没有 此操作将导致长时间计算,就资源而言其代价是高的。
技术实现思路
对于所述的技术问题的根据本专利技术的解决方案是,所述编码/解码在所述 给定频带中的多个相邻子带中实现,所述设备包括,在至少一个子带中,具 有增益补偿的知觉加权滤波器,其被适配来实现在所述具有增益补偿的知觉 加权滤波器的输出信号和与所述子带相邻的子带中的信号之间的频谱的连续 性。因此本专利技术的知觉加权设备实现一个或多个子带上所需的滤波,其限制 了计算的复杂性。而且,通过增益补偿消除了在知觉加权滤波的增益之间的从一个子带到另一个的不一致,这确保在整个频带上的频谱连续性。本专利技术由此在知觉加本文档来自技高网
...

【技术保护点】
一种用于在给定频带中编码/解码音频信号的知觉加权设备,其特征在于,所述编码/解码在所述给定频带中的多个相邻子带中被实现,所述设备包括,在至少一个子带中,具有增益补偿的知觉加权滤波器(307),其被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和与所述子带相邻的子带中的信号之间的频谱的连续性。

【技术特征摘要】
【国外来华专利技术】FR 2006-2-14 06505381. 一种用于在给定频带中编码/解码音频信号的知觉加权设备,其特征在于,所述编码/解码在所述给定频带中的多个相邻子带中被实现,所述设备包括,在至少一个子带中,具有增益补偿的知觉加权滤波器(307),其被适配来实现在所述具有增益补偿的知觉加权滤波器的输出信号和与所述子带相邻的子带中的信号之间的频谱的连续性。2. 如权利要求l所述的设备,其特征在于,所述具有增益补偿的知觉加 权滤波器(307)包括知觉加权滤波器(501、 502)和增益补偿模块(503 )。3. 如权利要求2所述的设备,其特征在于,所述增益补偿模块(503 ) 是布置在所述知觉加权滤波器(501、 502)的输出端。4. 如权利要求2所述的设备,其特征在于,所述增益补偿模块是布置在 所述知觉加权滤波器的输入端。5. 如权利要求l所述的设备,其特征在于,所述具有增益补偿的知觉加 权滤波器包括合并增益补偿的知觉加权滤波器。6. 如权利要求2到5中任何一项所述的设备,其特征在于,所述知觉加 权滤波器具有形式2^々/」/」>々2」,其中/I表示线性预测滤波器且0^S1 和0 ^力^ 1 。7. 如权利要求6所述的设备,其特征在于,所述增益补偿的实现依据等 于下式的因子/^的乘法,/c=^f-/=0其中4是所述线性预测滤波器i向的系数, 其中J(^) = & + 7 + d2z-2 +…+ 4^z—p。8. —种用于在划分成相邻的第一和第二子带的频带中使用的分级音频编 码器,所述编码器包括.用于编码在所述频带的第一子带中的原始信号的核心编码器(305;905 );-用于从所述原始信号和来自所述核心编码器的信号中计算残差信号(e ) 的级(306;卯6); 用于知觉加权所述残差信号(e)的设备;其特征在于,所述知觉加权设备包括具有增益补偿的知觉加权滤波器 (307; 907),其被适配来实现在所述具有增益补偿的知觉加权滤波器的输出 信号和在第二子带中的信号之间的频镨的连续性。9. 如权利要求8所述的编码器,其特征在于,所述具有增益补偿的所述 知觉加权滤波器(307)包括在第一子带中的知觉加权滤波器(501、 502)。10. 如权利要求9所述的编码器,其特征在于,所述在第一子带的知觉 加权滤波器(501、 502)具有形式J/z/)^/i^/)^,其中i,^)表示线性预测 滤波器且0 ^ ^ 1和0 ^力^ 1。11. 如权利要求IO所述的编码器,其特征在于,所述在第一子带的增益 补偿的实现依据等于下式的因子/ac,的乘法,<formula>formula see original document page 3</formula>其中4是所述线性预测滤波器A向的系数, 其中= A + A一 + ^z-2 + ...+ dpZ.P。12. 如权利要求IO或11所述的编码器,其特征在于,通过所述核心编 码器(305 )提供所述线性预测滤波器的系数。13. 如权利要求8到12中任何一项所述的编码器,其特征在于,在第一 子带的来自知觉加权设备(307 )的信号和在第二子带中的原始信号被施加到 各自的变换分析模块(308, 311),并且所述变换分析模块被连接到在所述频 带的变换编码器(313)。14. 如权利要求8到13中任何一项所述的编码器,其特征在于,所述编 码器也包括用于对第二子带的原始信号进行知觉加权的知觉加权设备,其包 括具有增益补偿的知觉加权滤波器(912),被适配来实现在所述具有增益补 偿的知觉加权滤波器(912 )的输出信号...

【专利技术属性】
技术研发人员:斯蒂芬拉戈特罗曼特里林
申请(专利权)人:法国电信公司
类型:发明
国别省市:FR[法国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1