当前位置: 首页 > 专利查询>西门子公司专利>正文

评估编解码参数的方法技术

技术编号:3046730 阅读:191 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种评估编解码参数的方法。所述方法尤其应用于根据诸如在语音编码中出现的放大系数和语音基频值以全部已知的方式评估滤波系数。组合利用外插法、内插法和线性预测进行评估。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种对在语音编码过程中所产生的参数,尤其是滤波系数、放大系数或者语音基频进行评估的方法。在数字通信系统例如因特网或者移动无线电系统,如GSM或UMTS中使用源编码方法,例如语音、音频、图像或视频编码方法,以降低传输的位速率。所述源编码方法通常提供一个分配于帧中的位流。在GSM系统中进行语音传输时,一个帧的语音编码位代表20ms的语音信号。此外,一个帧中的所述位代表一个确定的参数组。这些参数描述了例如语音信号的频谱包络、语音基频或者信号能量或强度。一个帧又多次划分为子帧,这样每一帧传输多个参数一次,每一个子帧再一次传输这些参数。在具有7.4kbps的US-TDMA增强全速率(EFR)语音编码中,一个20ms的帧包含148位。这里的一个帧由四个子帧组成。这里的所述参数具体为-一个滤波器的10个系数量化为每帧具有26位,其中所述滤波器表示在当前帧范围内的语音信号的频谱包络。这些系数也称作频谱系数或者频谱参数。-用4×7位量化该滤波器的激励信号的四个子帧。-用2×8位和2×5位表示语音基频的四个值。-用4×7位矢量量化每帧的四个放大系数对。因此可以说一个帧内的这些位通常表示一个确定的参数组,所述参数组总是取决于所应用的源编码方法。在发射端通过所谓的源编码从帧内的数字信号中取消冗余码。在接收端通过源解码,例如语音解码尽可能地取消冗余码。这时可能发生单个帧或者多个相继的帧丢失或者被网络单元标识为不可用的。这些帧即所谓的“坏帧”因此可以或者应该不被使用。源解码器,例如语音解码器必须在接收端采取措施,即这种帧损失尽可能地不可听或者在图像或视频传输中不可见。一般地,在接收端存在一个指示符,所述指示符指示一个帧是否被无误地接收,即所谓的坏的帧指示符(BFI)。BFI=0意味如下以此为起始,即所接收的帧是正确的,而BFI=1表明存在一个错误,例如没有及时接收帧或者接收一个破坏帧。当然在帧内根据系统情况可以出现位错误,即称作个别位的翻转。但是或者这不应该在接收端进行进一步地差分处理或者相应的帧被标识为BFI=1。到目前为止,由已经解码的语音信号的过去引起的BFI=1的情况,例如通过相关图像来评估当前的语音信号帧。已知的替代方法为从语音编解码参数的过去,首先评估当前帧的参数,当这些评估的参数值正确时,然后以类似的方式使解码器工作。这通常以外插法处理,所述外插法只与已经接收的位或者参数值有关。当通过因特网,例如IP上的语音(VoIP),或者通过因特网连接移动通信系统(例如GSM或者UMTS)一起进行语音传输时,接收端需要一个缓冲存储器(缓存器),因为所接收的分组不是以固定的时间间隔到达,而是以不同的延时到达(延时抖动)。如果必要,这种缓冲存储器可以在长度上包括多个个帧,以此可以避免由于增加传输延迟的开销而引起的帧丢失。然而也经常发生这种情况,即多个的相继帧丢失,而随后的帧被正确地接收。在这些情况下,当使用缓冲存储器时,用丢失帧的语音编解码参数的内插法代替传统的外插法是有利的,因为内插法一般比较精确。一个简单的解决方案是在最后解码帧(时刻t=n-1)的参数值和正确接收帧(时刻t=m>n)的参数值的基础上在其间所有m-n个丢失帧(时刻t=n,n+1,…,m-1)进行线性内插法。缓冲存储器以及参数内插法还可以在数据流应用中实现,因为所述缓冲存储器以及参数内插法通常对于延时不敏感。然而,因此会产生不利的影响,即提供的参数不可以简单地插值。为此常常计算放大系数、语音基频值或者语音帧在时刻t的频谱参数V_i(t),因为它们被差分编码。语音帧的频谱参数V_i(t)在例如取决于时间的数字滤波器的滤波系数的语音编码情况中,借助音轨建立模型例如根据LPC原理(线性预测编码)编码语音。在这种情况下,浊音通过脉冲的周期顺序产生,清音例如通过一个随机噪声发生器产生。破裂音通过强度的改变模拟,音轨通过随时间变化的数字滤波器模拟。人们借助线性预测,即在前面值的基础上预测下面值以得到变化的数字滤波器的系数。对于差分或者预测的编码,人们理解为在时刻n一个参数的编码,其中也包括在时刻n之前的参数值的编码。按照下面实施例,参数例如可以是放大系数、语音基频或者频谱参数。频谱参数的通常形式例如是滤波系数本身(以所谓的直接形式)、自相关系数、反射系数或者所谓的日志区域比率(Log-area-Ratios)。现有技术例如是ISF(模拟(imittance)频谱频率)、LSF(线性谱频率)或者LSP(线性频谱对)。为了简便起见,下面没有一般性限制地假定参数为频谱系数。参数V_i(t)的差分编码和解码可以例如按下列方式实现在发射端差分信号X_i(t=n)根据下式确定X_(n)=V_i-a_i*Q[X_i(n-1)],i=1,2,…,10(1)其中V_i(n)是编码的参数,a_i是预测系数,Q[X_i(n-1)]是量化的差分信号,所述差分信号被确定用于编码前面帧中的V_i(n-1)。量化通常应用所谓的矢量量化。对此可以理解为多个X_i(n)对于确定的i值的共同量化。矢量量化还意味着可以共同量化两个或者多个个不同的、在语音编码方法中出现的参数类型。在所述情况中,矢量量化可以如下所示i=1,2,3、i=4,5,6以及i=7,8,9,10。量化的差分信号Q[X_i(n)],i=1,2,…,10还通过位的数量表示,例如每个帧26位,以及传输。从等式(1)清楚地看出这样的编码引起数据压缩,即用于差分值X_i的存储消耗比用于V_i值的存储消耗低,其中差分值X_i表示几乎相同大小的数量在接收端频谱参数V_i(n)的量化值W_i(n)由当前接收的差分信号值Q[X_i(n)]和以前接收的Q[X_i(n-1)]重构而成W_i(n)=a_i*Q[X_i(n-1)]+Q[X_i(n)],i=1,2,…,10(2)这里所描述的参数解码形式在许多当前使用的编码方法中是常见的,此外例如在AMR和EFR语音编码器(自适应多速率或者增强全速率)中。当然,原理上还可设想较高级的预测。等式(1)、(2)中所提及的准则通常用于降低在平均值左右的参数值。所述平均值最后作为加法再添加给一个常数。如上面示例性所描述的,预测编码对于插值确定丢失帧的频谱系数具有缺点在第一级的预测量化中(见等式(1)和(2)),插值确定量化的参数值W_i(n)需要接收两个相继的量化差分信号值{Q[X_i(m)],Q[X_i(m+1)]},这在分组交换的传输方式时常常恰好不是这种情况。这种情况在下面更详细地说明;为此,量化的差分信号Q[X_i(n)]在下面称作数值Y_i(n)即为W_i(n)=a_i*Y_i(n-1)+Y_i(n),i=1,2,…,10(3)下面假定已经根据等式(3)解码的最后的帧为时刻t=n-1,以及当前帧t=n应该被解码,但存在BFI(n)=1,即存在一个“坏”帧。这时帧t=m>n是t=n-1之后的第一个帧,对于该帧为BFI=0。具有BFI=1的、所有其它m-n个中间帧的频谱系数这时应该被插值。频谱系数W_i(n-1)这时形成内插法的下(即过去发生的)基准点。频谱系数W_i(m)一般应该形成内插法的上(即未来发生的)基准点。但在预测编码中不能计算频谱系数,因为对于等式(3)来说,虽然接收数值Y_本文档来自技高网...

【技术保护点】
用于在接收端评估在第n时刻随时间变化的参数值的方法,-其中在发射端预测编码所述参数,-其中在接收端确定所述参数为至少两个数值的函数,其特征在于,-在接收端插值确定所述参数,-其中被解码的参数值作为第一数值,所 述参数指定给比第n时刻早的一个时刻,所述第一数值形成所述内插的一个基准点,以及-通过外插法确定第二数值,所述第二数值指定给第n时刻之后的一个时刻,所述第二数值形成内插法的另一基准点。

【技术特征摘要】
DE 2001-5-18 10124421.51.用于在接收端评估在第n时刻随时间变化的参数值的方法,-其中在发射端预测编码所述参数,-其中在接收端确定所述参数为至少两个数值的函数,其特征在于,-在接收端插值确定所述参数,-其中被解码的参数值作为第一数值,所述参数指定给比第n时刻早的一个时刻,所述第一数值形成所述内插的一个基准点,以及-通过外插法确定第二数值,所述第二数值指定给第n时刻之后的一个时刻,所述第二数值形成内插法的另一基准点。2.用于在...

【专利技术属性】
技术研发人员:T芬谢德特J吉塔特佩雷斯
申请(专利权)人:西门子公司
类型:发明
国别省市:DE[德国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1