用以使用混叠切换方案将音频信号编码/解码的装置与方法制造方法及图纸

技术编号:7139168 阅读:230 留言:0更新日期:2012-04-11 18:40
一种用于编码音频信号的装置,包含窗口化器(11),用于使用具有混叠部及另一部的分析窗口来窗口化该音频信号的第一块。该装置进一步包含处理器(12),用于通过将该第一子块窗口化之后,将该子块由一域变换至一不同域来处理与该混叠部相关联的该音频信号的第一子块而获得已处理的第一子块;以及用于通过在窗口化该第二子块之前,将该第二子块由该域变换至该不同域来处理与该另一部相关联的该音频信号的第二子块而获得已处理的第二子块。此外,该装置包含变换器,用于使用相同块变换规则,将该已处理的第一子块及该已处理的第二子块由该不同域变换至又一个不同域来获得已变换的第一块,然后该块可使用众所周知的数据压缩算法中的任一者压缩。如此,由于出现在不同域的混叠部彼此匹配,故可获得两种编码模式间的临界采样的切换。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频编码,更特别地,涉及低比特率音频编码方案。
技术介绍
在现有技术中,已知频域编码方案,诸如MP3或AAC。这些频域编码器基于时域/ 频域变换;随后是量化级,其中使用来自心理声学模块的信息控制量化误差;及编码级,其 中使用码表对该已量化的频谱系数及相对应辅助信息进行熵编码。另一方面,存在极为适合用于语音处理的编码器,诸如AMR-WB+,在3GPP TS 沈.290对此进行了说明。这种语音编码方案执行时域信号的线性预测滤波。这种LP滤波 是由该输入的时域信号的线性预测分析所导出。然后,所得的LP滤波系数经量化/编码, 并作为辅助信息传输。该方法称作为线性预测编码(LPC)。在滤波器的输出端,使用ACELP 编码器的合成-分析级,或另外地,使用变换编码器,对预测残留信号或预测误差信号(也 称作为激励信号)进行编码,该变换编码器使用具有重叠的傅立叶变换。ACELP编码与变换 编码激励编码(也称作为TCX编码)间的判定是使用闭环或开环算法进行的。组合AAC编码方案及频带复制技术的频域音频编码方案(诸如高效率-AAC编码 方案)也可与借助于术语“MPEG环绕”一词而已知的联合立体声编码工具或多声道编码工 具组合。另一方面,语音编码器(诸如AMR-WB+)也有高频加强级及立体声功能。频域编码方案的优点在于,其对于音乐信号,以低比特率显示高质量,但问题在于 低比特率的语音信号的质量。语音编码方案即使以低比特率也对语音信号显示高质量,但对音乐信号,以低比 特率显示的质量不佳。频域编码方案经常使用所谓的MDCT(MDCT =修改型离散余弦变换)。MDCT最初 在 J. Princen, A. Bradley 的“Analysis/Synthesis Filter Bank Design Based on Time Domain Aliasing Cancellation (基于时域混叠抵消的分析/合成滤波器组设计)”,IEEE Trans. ASSP,ASSP-34(5) :1153-1161,1986 中进行了说明。MDCT 或MDCT 滤波器组广泛用于 近代且有效的音频编码器。这种信号处理提供下列优点各处理块间的平滑交叉衰减即使各个处理块的信号有不同变化(例如由于频谱 系数的量化),但由于窗口化重叠/加法操作,故不会因块之间的突然转换,造成遮蔽伪像。临界采样滤波器组的输出端的频谱值的数目等于其输入端的时域输入值与必须 传输的额外开销值的数目。MDCT滤波器组提供高频率选择性及编码增益。利用时域混叠抵消技术,可实现这些重大性质。时域混叠抵消是通过对两相邻已 窗口化信号进行重叠相加而在合成时进行的。如果在MDCT的分析级与合成级间未施加量 化,则获得原始信号的完美重建。但该MDCT是用于特别适合音乐信号的编码方案的。如前文所述,这些频域编码方案对于语音信号在低比特率下具有较低的质量,而特别适配的语 音编码器与频域编码方案相比,在相似的比特率下具有较高质量,甚至对于相同质量具有 显著更低的比特率。语音编码技术(诸如定义于“Extended Adaptive Multi-Rate-Wideband (AMR-WB+) codec (延伸的适应性多速率-宽带(AMR-WB+)编码解码 器),3GPP TS 26. 290 V6. 3. 0,2005-06,技术规范”的所谓的AMR-WB+编码解码器)并未应 用MDCT,因此无法由MDCT的优异性质获得任何优势,特别地,MDCT 一方面仰赖临界采样处 理,而另一方面仰赖由一个块至另一个块的跨越。因此,通过MDCT所得的由一个块至另一 个块的跨越就比特率而言不会有任何牺牲,因此尚未在语音编码器中获得MDCT的临界采 样性质。当将语音编码器及音频编码器组合于单一混合编码方案中时,仍然存在以下问 题如何以低比特率及高质量获得由一种编码模式至另一种编码模式的切换。
技术实现思路
本专利技术的目的是提供一种改良式编码/解码构想。本目的是通过如权利要求1的用于编码音频信号的装置、如权利要求8的用于解 码已编码音频信号的装置、如权利要求14的已编码音频信号、如权利要求15的用于编码音 频信号的方法、如权利要求16的用于解码已编码音频信号的方法、或如权利要求17的计算 机程序达成。本专利技术的一个方面在于应用混合编码方案,其中应用特别适合某些信号并操作于 一个域的第一编码模式,并且,共同使用特别适合其它信号并操作于不同域的另一编码模 式。在本编码/解码构想中,由一个编码模式至另一个编码模式的临界采样切换为可能在 于,在编码器端,已经由一次窗口化操作所产生的音频采样的同一个块是以不同方式处理 的。特别地,音频信号的该块的混叠部的处理方式是在将与窗口的混叠部相关的子块窗口 化之后,将该子块由一个域变换至另一域;而在对相同窗口化操作所得的不同子块使用分 析窗口窗口化之前,将该不同子块由一域变换至另一域。已处理的第一子块及已处理的第二子块随后使用相同块变换规则变换成又一域, 来获得该音频信号的已变换的第一块,其然后可使用众所周知的数据压缩算法(诸如量 化、熵编码等)中的任一种进一步进行处理。在解码器端,基于处理了该块的混叠部还是该块的其它另一部,以不同方式再度 处理此块。混叠部是在进行合成窗口化之前被变换到目标域的,而另一部是在变换至目标 域之前接受合成窗口化处理的。此外,为了获得临界采样性质,进行时域混叠抵消,其中在 另一已编码的音频信号块的混叠部变换至目标域之后组合该音频数据的窗口化混叠部及 该另一已编码块的窗口化混叠部,因此获得与该第一块的混叠部相对应的已解码音频信 号。有鉴于此,一个窗口确实存在有两个子块/部分。一个部分/子块(混叠子块)具有 混叠分量,其与在不同域中编码的第二块重叠;及第二子块/部分(另一子块)可具有或可 未具有混叠分量,其与第二块或不同于第二块的一块重叠。优选地,引入彼此相对应但在不同域中编码的某些部分的混叠可优异地用于通过 以不同方式处理音频采样的同一个已窗口化块内部的混叠部及另一部,而获得由一种编码模式至另一种编码模式的临界采样切换。此点与基于分析窗口及合成窗口的现有技术处理相反,原因在于至目前为止,通 过应用分析窗口所得的完整数据块接受相同处理。但根据本专利技术,已窗口化块的混叠部是 以与本块的另一部不同的方式处理的。当使用特定开始/停止窗口时,另一部可包含非混叠部。另外,另一部包含与相邻 窗口化处理所得的部分重叠的混叠部。然后,另一(混叠)部与在当前帧的另一(混叠) 部相同的域中处理的邻近帧的混叠部重叠,而混叠部与在当前帧的混叠部不同的域中处理 的邻近帧的混叠部重叠。依据不同的实现,另一部及混叠部共同形成对音频采样的块应用窗口函数的完整 结果。另一部可完全不含混叠,或可完全混叠,或可包括一混叠子部及一无混叠子部。此外, 可任意选择这些子部的顺序以及混叠部和另一部的顺序。在切换音频编码方案的较佳实施例中,输入信号的相邻分段可在两个不同 域中处理。举例而言,AAC在信号域计算MDCT,而MTPC (Sean A. Ramprashad,"The Multimode Transform predictive Coding Paradigm(多模式变换预测编码本文档来自技高网
...

【技术保护点】
一种用于编码音频信号的装置,包含:用于使用分析窗口将该音频信号的第一块窗口化的窗口化器(12),该分析窗口具有混叠部(L↓[k],R↓[k])及另一部(M↓[k]);处理器(12),用于通过在窗口化该音频信号的第一子块(20)之后将该音频信号的第一子块变换至与该音频信号所在的域不同的域来处理与混叠部相关联的该音频信号的第一子块,以获得已处理的第一子块;及用于通过在窗口化第二子块(21)之前将第二子块变换至所述不同的域来处理与该另一部相关联的该音频信号的第二子块而获得已处理的第二子块;及变换器(13),用于使用相同块变换规则,将该已处理的第一子块及该已处理的第二子块由所述不同的域变换至另一域而获得已变换的第一块,其中该装置被配置用于使用数据压缩算法进一步处理(14)该已变换的第一块。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:纪尧姆·福克斯
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1