用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法制造方法及图纸

技术编号:9521556 阅读:116 留言:0更新日期:2014-01-01 19:04
一种用于编码音频信号的部分(10)以获得该音频信号的部分的编码音频信号(26)的装置,其包含:瞬态检测器(12),其检测瞬态信号是否位于音频信号的部分中,以获得瞬态检测结果(14);编码器级(16),其针对音频信号执行第一编码算法、以及针对音频信号执行第二编码算法,第一编码算法具有第一特性,第二编码算法具有不同于第一特性的第二特性;处理器(18),其确定何种编码算法相对于另一编码算法使得编码音频信号更近似于音频信号的部分,以获得质量结果(20);以及控制器(22),其基于瞬态检测结果(14)和质量结果(20),确定要由第一编码算法或要由第二编码算法来产生音频信号的部分的编码音频信号。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】一种用于编码音频信号的部分(10)以获得该音频信号的部分的编码音频信号(26)的装置,其包含:瞬态检测器(12),其检测瞬态信号是否位于音频信号的部分中,以获得瞬态检测结果(14);编码器级(16),其针对音频信号执行第一编码算法、以及针对音频信号执行第二编码算法,第一编码算法具有第一特性,第二编码算法具有不同于第一特性的第二特性;处理器(18),其确定何种编码算法相对于另一编码算法使得编码音频信号更近似于音频信号的部分,以获得质量结果(20);以及控制器(22),其基于瞬态检测结果(14)和质量结果(20),确定要由第一编码算法或要由第二编码算法来产生音频信号的部分的编码音频信号。【专利说明】
本专利技术涉及音频编码,以及特别涉及交换式音频编码,其中,就不同的时间部分,使用不同的编码算法来产生编码信号。
技术介绍
可就不同的音频信号的部分而确定不同的编码算法的交换式音频编码器为所常见。示例为在国际标准3GPPTS26.290V6.1.0200412中定义的所谓的扩展型宽带调适性多比特率编解码器或AMRWB+编解码器。在此技术性说明书中,说明编码概念,其基于AMRWB编解码器、通过添加TCX (变换编码激发)、带宽扩展、和立体声,扩展ACELP (代数码本激励线性预测)。AMRWB+音频编解码器以内部取样频率Fs处理等于2048个样本的输入帧。内部取样频率限于12,800至38,400Hz的范围。2048个样本帧被分割成两个临界取样等频带。这产生两个对应于低频(LF)和高频(HF)带的1024个样本的超帧。每个超帧被分割成四个256样本帧。内部取样率下的取样通过使用可重新取样输入信号的可变取样转换方案来获得。LF和HF信号接着使用两个不同方式来加以编码。LF信号基于交换式ACELP和TCX而使用“核心”编码器/解码器来加以编码及解码。在ACELP模式中,使用标准化AMRWB编解码器。HF信号使用带宽扩展(BWE)方法,以相当少的位(16位/巾贞)来加以编码。自编码器传输至解码器的参数是模式选择位、LF参数和HF信号参数。每个1024样本超帧有关的参数被分解成四个同等大小的封包。当输入信号为立体声时,左和右声道组合成ACELP-TCX编码有关的单声道信号,而立体声编码接收两者的输入声道。在AMRWB+解码器结构中,LF和HF频带分开加以解码。接着,频带组合成合成滤波器组。若输出仅限于单声道,则立体声参数便被省略,以及解码器在单声道模式中运行。AMRffB+编解码器在编码LF信号时就ACELP和TCX模式两者应用LP (线性预测)分析。LP系数在每个64样本子帧下以线性方式加以内插。LP分析窗口是长度384样本的半余弦。编码模式基于闭环合成分析法来加以选择。就ACELP帧而言,只有256个样本帧被考虑,而在TCX模式中,可能有256、512、或1024个帧。ACELP编码包括长期预测(LTP)分析合成代数码本激励。在TCX模式中,知觉上加权的信号在变换域中加以处理。傅立叶变换的加权信号使用分割式多权量栅格量化(代数向量量化)来加以量化。变换在1024、512、或256个样本窗口中加以计算。激励信号通过逆加权滤波器对量化加权的信号进行逆滤波而加以恢复。为确定某一音频信号的部分是要使用ACELP模式还是TCX模式来加以编码,使用闭环模式选择或开环模式选择。在闭环模式选择中,使用11个接续的尝试。紧跟尝试之后,在两个要被比较的模式间作出模式选择。选择标准是加权的音频信号与合成的加权音频信号间的平均分段SNR(信号噪声比)。因此,编码器执行两者编码算法的完整编码,依据两者编码算法的完整解码,以及继而编码/解码两者运行的结果与原始信号作比较。因此,就每个编码算法而言,也即一方面是ACELP以及另一方面是TCX获得分段SNR值,以及使用具有通过就个别的子帧对分段SNR值平均化而对帧确定的较佳的分段SNR值或具有较佳的平均分段SNR值的编码算法。附加的交换式音频编码方案为所谓的USAC编码器(USAC=联合语音音频编码)。此编码算法说明在IS0/IEC23003-3中。一般性结构可说明如下。首先,其中有常见的前/后处理系统,其具有操控立体声或多声道处理的MPEG环场功能单元和用于产生输入信号的较高音频频率的参数表示的增强型SBR单元。接着,其中具有两条分支,一条分支包括改进的先进型音频编码(AAC)工具路径、以及另一条分支包括线性预测编码(LP或LPC域)式路径,其复赋有的特色是,LPC残差或以频域表示或以时域表示。所有就AAC和LPC两者所传输的频谱表示在紧接量化和算术编码后的MDCT域中。时域表示使用ACELP激励编码方案。解码器的功能为要找出比特流载荷中的量化音频频谱或时域表示的叙述,以及要解码量化值和其它重建信息。因此,编码器执行两个决策。第一项决策为要执行频域对线性预测域模式决策有关的信号分类。第二项决策为要在线性预测域(LPD)内确定某一信号部分是使用ACELP还是使用TCX来加以编码。为在需要极低延迟的情景中应用交换式音频编码方案,必须要特别留意变换式编码部分,因为这些编码部分引入取决于变换长度和窗口设计的特定延迟。所以,USAC编码概念由于具有涉及变迁式窗口的相当可观的变换长度和长度调适性(也已知为块交换)的改进型AAC编码分支所致,并不适用于极低延迟应用。另一方面,AMR-WB+编码概念由于编码器侧决定要使用ACELP还是TCX,被发现很是棘手。ACELP可提供良好的编码增益,但在信号部分不适合ACELP编码模式时,可能有显著的音频质量问题产生。因此,就质量的理由而言,一旦输入信号未包含语音,人们或许会倾向于使用TCX。然而,在低比特率下过多地使用TCX将造成比特率问题,因为TCX提供的是相当低的编码增益。所以,当人们更关注编码增益时,一旦有可能,人们会使用ACELPdM正如先前所陈述,这会由于ACELP举例而言就音乐和类似静态信号而言并非最佳的事实,而造成音频质量的问题。分段SNR计算是质量计量,其可仅基于结果、也即原始的信号或经编码/解码的信号间的SNR是否较佳,确定较佳的编码模式,以致使用较佳的SNR中所产生的编码算法。然而,这始终必须要在比特率限制条件下运行。所以,仅使用质量计量(诸如举例而言,分段SNR计量)已发现并不总在质量与比特率之间产生最佳的折衷。本专利技术的目的为提供用于编码音频信号的部分的改进概念。通过一种依据权利要求1的用于编码音频信号的部分的装置、或通过一种依据权利要求14的用于编码音频信号的部分的方法,实现该目的。
技术实现思路
本专利技术基于的研究结果是,适用于较多瞬态信号部分的第一编码算法与适用于较多静态信号部分的第二编码算法间的较佳决策可在决策不但基于质量计量而且附加地基于瞬态检测结果时获得。虽然质量计量仅着眼于与原始信号相关的编码/解码链的结果,但是瞬态检测结果附加地单单取决于原始输入音频信号的分析。因此,已发现,最后确定要以何种编码算法来编码音频信号的部分的两者计量(即,一方面的质量结果和另一方面的瞬态检测结果)的组合在一方面的编码增益与另一方面的音频质量间导致改善的折衷。一种用于编码音频信号的部分以获得音频信号的部分的编码音频信号的装置包括本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:克里斯蒂安·黑尔姆里希纪尧姆·富克斯戈兰·马尔科维奇
申请(专利权)人:弗兰霍菲尔运输应用研究公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1