当前位置: 首页 > 专利查询>奥兰治专利>正文

音频信号重采样方法/装置以及音频信号编/解码器制造方法及图纸

技术编号:14975619 阅读:71 留言:0更新日期:2017-04-03 03:18
本发明专利技术涉及一种用于在音频信号编码或解码中对音频信号重采样的方法。该方法针对每个有待重采样的信号块包括以下步骤:‑通过自适应线性预测来确定(E401)未来信号样本的数量,此数量是根据所选择的重采样延迟来限定的;‑至少根据该当前块的多个样本以及所确定的多个未来信号样本而构建(E402)重采样支持向量;‑将重采样滤波器应用(E403)于该重采样支持向量的多个样本。本发明专利技术还涉及一种实现所描述的方法的重采样装置、包括至少一个装置的编码器和解码器。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及对音频信号进行处理以便对其进行传输或存储。更具体地,本专利技术涉及在对音频信号进行编码或解码时采样频率的变化。
技术介绍
存在许多技术用于压缩(有损耗)音频信号(如语音或音乐)。编码可以直接在输入信号的采样频率下进行,如例如在ITU-T建议G.711或G.729中那样,其中,在8kHz下对输入信号进行采样,并且编码器和解码器在此同一个频率下进行操作。然而,一些编码方法使用采样频率的变化来例如降低编码的复杂度、根据不同的有待编码的频率子带对编码进行适配、或者对输入信号进行转换以使其与编码器的预定义内部采样频率相对应。在ITU-T建议G.722中定义的子带编码中,在16kHz上的输入信号被划分成由ADPCM(自适应差分脉冲编码调制)型编码器单独编码的2个子带(在8kHz下进行采样)。这种划分成两个子带是由23阶的具有有限脉冲响应的二次模镜像滤波器组所实施的,其理论上产生16毫秒23个样本的分析合成延迟(编码器+解码器);该滤波器组是用多相实现方式来实现的。G.722中划分成两个子带使得可以根据其先验感知重要性来以预定方式向这两个子带分配不同的比特率,并且还通过在较低频率下执行两个ADPCM型编码器来降低总体编码复杂度。然而,与直接ADPCM编码相比较,其引起了算法延迟。已知各种用于通过使用(例如并且以非详尽的方式)FIR(有限脉冲响应)滤波器、IIR(无限脉冲响应)滤波器或多项式插值(包括样条)来改变数字信号的采样频率(又称为重采样)的方法。可以在例如R.W.沙费尔(R.W.Schafer)、L.R罗宾纳(L.R.Rabiner)的文章“DigitalSignalProcessingApproachtoInterpolation(插值的数字信号处理法)”电气与电子工程师协会会报,第61卷,第6期,1973年6月,692-702页中找到对常规重采样方法的综述。FIR滤波器(对称型)的优点在于其简化的实现方式并且——受制于某些条件——在于确保线性相位的可能性。线性相位滤波使得可以保存输入信号的波形,但其还可能伴有可能在瞬态产生前回波型伪信号的时间扩展(或振荡)。本方法引起一般大约1毫秒到几毫秒的延迟(其取决于脉冲响应的长度)以确保适当的滤波特性(带宽中的纹波、足以消除混叠图像或频谱图像的抑制水平……)。通过IIR滤波器进行采样的替代方案一般产生非线性相位,除非通过如在例如P.A.雷加利亚(P.A.Regalia)、S.K.密特拉(S.K.Mitra)、P.P.威德亚纳森(P.P.Vaidyanathan)的以下文章中所描述的附加全通滤波级与MATLAB软件的“iirgrpdelay”例程的示例性实现方式一起对相位进行补偿:“TheDigitalAll-PassFilter:AVersatileSignalProcessingBuildingBlock”(数字全通滤波器:通用信号处理构造块),电气与电子工程师协会会报,第76卷,第1期,1988年1月;IIR滤波器一般具有较低阶但在定点表示法中实现起来更加复杂,滤波器的状态(或记忆)针对递归部分能够达到较高的动态值,并且如果采用通过全通滤波进行相位补偿,则这个问题被放大。图1展示了通过在64kHz下具有2*60+1=121个系数长度的FIR滤波器按照4/5的比率从16kHz变化到12.8kHz进行下采样的示例。x轴表示时间(基于毫秒以表示在不同频率下计时的信号),并且y轴表示振幅。顶部的正方形表示在16kHz下的输入信号的样本的时间位置;这里,假设这些样本与20毫秒的帧的末尾相对应。实竖直线标记在16kHz下的相应采样时刻。在该图的底部,虚竖直线标记在12.8kHz下的相应采样时刻,并且星形表示在12.8kHz下的输出样本。还表示了FIR滤波器在64kHz下的121个系数的脉冲响应(对称型),这个响应被定位成用于计算当前帧在12.8kHz下的最后的样本(脉冲响应最大值的位置与这个样本相对准)。那些圆形示出了多相表示中所使用的值(与输入采样时刻相对应);为了获得输出样本,这些值乘以相应的输入样本,并且将这些结果加在一起。在这个图中应注意的是,无法确切地计算在12.8kHz下的12个样本(直到输入帧的末尾),因为当前帧的末尾(下一个帧的开头)之后的输入样本还未知;图1的情况中的下采样延迟是12个样本,即,12/12.8=0.9375毫秒。有多种技术用于减小由FIR类型的采样频率的变化所引起的延迟。在3GPPAMR-WB标准(还被定义为ITU-T建议G.722.2)中,在应用CELP型的编码之前,以12.8kHz的内部频率对在16kHz下采样的输入信号进行下采样;然后,在16kHz下对在12.8kHz下解码的信号进行重采样,并且将其与高频带信号进行组合。穿过12.8kHz的中频频率的优点在于其使得可以降低CELP编码的复杂度并且还具有是2的幂次方的倍数的帧长度,这方便了对某些CELP参数的编码。所使用的方法是通过FIR滤波器(在64kHz下具有121个系数)按照因数4/5进行的常规重采样,其中,通过多相实现方式来最小化复杂度。理论上,这种在编码器上以及在AMR-WB解码器上进行的重采样应当以与图1中所表示的处理相类似的方式产生延迟。在AMR-WB编解码器的情况下,具有121个系数的FIR滤波器,总延迟理论上应当是在64kHz下2×60个样本,即,在16kHz下2×15个样本或者1.875毫秒;实际上,在AMR-WB编码器上实现一种特定技术从而仅消除(补偿)在编码器部分中的相关联延迟并且因此将有效延迟除以2。在3GPP标准TS26.190条款5.1以及ITU-T建议G.722.2条款5.1中描述了这种补偿方法。这种用于补偿FIR滤波延迟的方法在于:为在16kHz下采样的有待转换到12.8kHz的每个新帧在当前帧的末尾添加预定数量的零。在输入采样频率下对这些零进行定义,并且它们的数量与重采样FIR滤波器在此频率下的延迟相对应(即,在16kHz下添加15个零)。每个20毫秒帧(320个样本)实施一次重采样。因此,AMR-WB编码器中的重采样相当于在左侧(朝过去)用从前一个帧的末尾开始的30个样本(重采样记忆)并且在右侧用15个零来补充具有320个样本的输入帧,从而形成具有30+320+15=365个样本的向量,然后,以因数4/5对该向量进行重采样。因此,由于添加了空的未来信号,可以用零相位来实现FIR滤波器,因此没有延迟;理论上,根据以下步骤进行按因数4/5进行的FIR重采样:-通过在每个本文档来自技高网...

【技术保护点】
一种用于在音频信号编码或解码中对音频信号进行重采样的方法,其特征在于,该方法针对每个有待重采样的信号块包括以下步骤:‑通过自适应线性预测来确定(E401)未来信号样本的数量,此数量是根据所选择的重采样延迟来限定的;‑至少根据该当前信号块的多个样本以及所确定的多个未来信号样本而构建(E402)重采样支持向量;‑将重采样滤波器应用(E403)于该重采样支持向量的多个样本。

【技术特征摘要】
【国外来华专利技术】2013.09.30 FR 13594561.一种用于在音频信号编码或解码中对音频信号进行重采样的方法,其特征在于,该
方法针对每个有待重采样的信号块包括以下步骤:
-通过自适应线性预测来确定(E401)未来信号样本的数量,此数量是根据所选择的重
采样延迟来限定的;
-至少根据该当前信号块的多个样本以及所确定的多个未来信号样本而构建(E402)重
采样支持向量;
-将重采样滤波器应用(E403)于该重采样支持向量的多个样本。
2.如权利要求1所述的方法,其特征在于,所述通过自适应线性预测进行确定的步骤包
括以下步骤:
-获得(E506)具有预定阶数的线性预测滤波器的多个系数;
-通过将所获得的该预测滤波器应用于为空值的激励信号来获得(E507)多个未来信号
样本。
3.如权利要求2所述的方法,其特征在于,该线性预测滤波器的这些系数是通过读取在
该编码步骤或解码步骤中所存储的多个参数而获得的。
4.如权利要求2所述的方法,其特征在于,该线性预测滤波器的这些系数是通过分析至
少根据该当前块的多个样本中获得的。
5.如权利要求1所述的方法,其特征在于,对已经执行了预加重处理的音频信号执行该
线性预测。
6.如权利要求1所述的方法,其特征在于,该自适应线性预测是来自以下方法之一的预
测:
-短期线性预测;
-长期线性预测;
-短期线性预测与长期线性预测的组合;
-擦除帧隐藏过程。
7.一种用于在音频信号编码器或解码器中对音频信号进行重采样的装置,其特征在
于,该装置包括:
-自适应线性预测模块(301),该自适应线性预测模块适用于针对信号块确定根据所...

【专利技术属性】
技术研发人员:B科维西S拉戈特
申请(专利权)人:奥兰治
类型:发明
国别省市:法国;FR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1