丢包后解码音频信号的时间扭曲制造技术

技术编号:3044116 阅读:239 留言:0更新日期:2012-04-11 18:40
本发明专利技术描述了一种用于解码器以在一系列帧中的丢失帧和紧跟该丢失帧后的一个或多个接收帧之间进行转换的技术。根据所述技术,基于合成的输出音频信号产生外插信号。所述外插信号和与所述接收帧相关的解码音频信号之间的时滞被计算出来,其中所述时滞表示所述外插信号与所述解码音频信号之间的相位差。然后基于所述时滞对所述解码音频信号进行时间扭曲。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种在语音或音频编码器中隐藏丢包导致的质量降低效果的系统和方法。
技术介绍
在声音或音频信号通过分组网络进行数字传输的过程中,编码的声音/音频信号通常被分割成帧,然后封装成包,其中每个包可包含一个或多个编码声音/音频数据的帧。然后通过分组网络传输这些包。有时候一些包会丢失,而且一些有用的包会太晚到达,从而被认定为丢失。这种包丢失会引起音频质量的显著降低,除非使用特殊的技术来隐藏丢包所导致的效果。 当前存在用于独立块编码器或全频带预测编码器的基于外插音频信号的包丢包隐藏(packet loss concealment,缩写为PLC)方法。这种PLC方法包括以下美国专利申请中所公开的技术申请号为11/234,291、专利技术人为陈、名称为“用于独立块语音编解码器的丢包隐藏技术”的美国专利申请和申请号为10/183,608、专利技术人为陈、名称为“用于预测语音编码的基于外插语音波形的帧删除隐藏方法和系统”的美国专利申请。然而,在这些申请中描述的技术不能直接用于子带预测编码器,如ITU-T推荐G.722宽带语音编码器,这是因为存在这些技术未能解决的子带特定结构问题。本文档来自技高网...

【技术保护点】
一种用于解码表示编码音频信号的一系列帧的解码器中的方法,用于在所述一系列帧内的丢失帧与紧随所述丢失帧后的一个或多个接收帧之间进行转换,其特征在于,所述方法包括: 合成与所述丢失帧相关联的输出音频信号; 基于所述合成的输出音频信号产生外插信号; 计算所述外插信号和与所述接收帧相关联的解码音频信号之间的时滞,其中所述时滞表示所述外插信号与所述解码音频信号之间的相位差;及 基于所述时滞对所述解码音频信号进行时间扭曲,其中对所述解码音频信号进行时间扭曲包括在时域上拉伸或收缩所述解码音频信号。

【技术特征摘要】
【国外来华专利技术】US 2006-8-15 60/837,627;US 2006-9-29 60/848,049;US1.一种用于解码表示编码音频信号的一系列帧的解码器中的方法,用于在所述一系列帧内的丢失帧与紧随所述丢失帧后的一个或多个接收帧之间进行转换,其特征在于,所述方法包括合成与所述丢失帧相关联的输出音频信号;基于所述合成的输出音频信号产生外插信号;计算所述外插信号和与所述接收帧相关联的解码音频信号之间的时滞,其中所述时滞表示所述外插信号与所述解码音频信号之间的相位差;及基于所述时滞对所述解码音频信号进行时间扭曲,其中对所述解码音频信号进行时间扭曲包括在时域上拉伸或收缩所述解码音频信号。2.根据权利要求1所述的方法,其特征在于,计算所述外插信号和所述解码音频信号之间的时滞包括最大化所述外插信号和所述解码音频信号之间的相关性。3.根据权利要求2所述的方法,其特征在于,最大化所述外插信号和所述解码音频信号之间的相关性包括搜索零附近±MAXOS的时滞范围内所述外插信号和所述解码音频信号之间的标准化交叉相关性函数R(k)的峰值k=-MAXOS,K,MAXOS其中es是外插信号,x是解码音频信号,MAXOS是允许的最大偏移,LSW是滞后搜索窗口长度,i=0表示在滞后搜索窗口中的第一采样。4.根据权利要求1所述的方法,其特征在于,计算所述外插信号和所述解码音频信号之间的时滞包括使用第一滞后搜索范围和第一滞后搜索窗口搜索所述外插信号与所述解码音频信号之间的标准化交叉相关性函数的第一峰值以确定粗时滞,其中所述第一滞后搜索范围是指在所述搜索过程中平移所述外插信号的起始点的范围,所述第一滞后搜索窗口是指计算所述标准化交叉相关性函数的采样数量;及使用第二滞后搜索范围和第二滞后搜索窗口搜索所述外插信号与所述解码音频信号之间的标准化交叉相关性函数的第二峰值以确定细化时滞,其中第二滞后搜索范围小于第一滞后搜索范围。5.根据权利要求4所述的方法,其特征在于,搜索所述外插信号与所述解码音频信号之间的标准化交叉相关性函数的第一峰值包括搜索所述外插信号与所述解码音频信号的向下采样样本之间的标准化交叉相关性函数的峰值。6.根据权利要求4所述的方法,其特征在于,所述第二滞后搜索窗口小于第一滞后搜索窗口。7.根据权利要求4所述的方法,其特征在于,使用第二滞后搜索和第二滞后搜索窗口搜索所述外插信号与所述解码音频信号之间的标准化交叉相关性函数的第二峰值包括将所述第二滞后搜索窗口与所述接收帧的叠加区域的中心对齐。8.根据权利求1所述的方法,其特征在于,计算所述外插信号和所述解码音频信号之间的时滞包括部分地解码所述接收帧以产生所述解码音频信号的近似值;及计算所述外插信号与所述解码音频信号的近似值之间的时滞。9.根据权利要求8所述的方法,其特征在于,部分地解码所述接收帧包括在低带自适应差分脉冲编码调制解码器中解码与所述接收帧相关联的低带比特流以产生低带重构信号;及使用所述低带重构信号作为所述解码音频信号的近似值。10.根据权利要求9所述的方法,其特征在于,在低带自适应差分脉冲编码调制解码器中解码与所述接收帧相关联的低带比特流包括在所述低带比特流的解码过程中固定两极、六-零自适应滤波器的系数。11.根据权利要求1所述的方法,其特征在于,所述方法进一步包括将所述经时间扭曲的解码音频信号和从所述合成的输出音频信号外插得到的波形片段叠加。12.根据权利要求1所述的方法,其特征在于,将所述经时间扭曲的解码音频信号和从所述合成的输出音频信号外插得到的波形片段叠加包括将与所述经时间扭曲的解码音频信号相关联的叠加区域在时间上前移以占用解码器不稳期间。13.根据权利要求1所述的方法,其特征在于,在时域上拉伸所述解码音频信号包括周期性地执行以下步骤重复所述解码音频信号的一采样样本;及将所述解码音频信号的一部分一直到包括所述重复的采样样本以及紧随所述重复的采样样本后的所述解码音频信号部分进行叠加。14.根据权利要求1所述的方法,其特征在于,在时域上收缩所述解码音频信号包括周期性地执行以下步骤从所述解码音频信号中丢弃一个采样样本;及将所述被丢弃的采样样本前的所述解码音频信号部分与紧随所述被丢弃的采样样本后的所述解码音频信号部分进行叠加。15.根据权利要求1所述的方法,其特征在于,所述方法进一步包括基于所述时滞对从所述合成的输出音频信号外插得到的波形片段进行时间扭曲,其中对所述波形片段进行时间扭曲包括在时域上对所述波形片段进行拉伸或收缩。16.根据权利要求1所述的方法,其特征在于,所述方法进一步包括基于所述时滞对所述合成的输出音频信号进行时间扭曲,其中对所述合成的输出音频信号进行时间扭曲包括在时域上对所述波形片段进行拉伸或收缩。17.一种系统,其特征在于,包括用于对表示编码音频信号的一系列帧中的接收帧进行解码的解码器;用于合成与所述一系列帧中的丢失帧相关联的输出音频信号的音频信号合成器;时间扭曲逻辑,用于基于所述合成的输出音频信号产生外插信号,计算所述外插信号和与所述一系列帧中紧随丢失帧后的一个或多个接收帧相关联的解码音频信号之间的时滞,以及基于所述时滞对所述解码音频信号进行时间扭曲;其中所述时滞表示所述外插信号与所述解码音频信号之间的相位差,且对所述解码音频信号进行时间扭曲包括在时域上拉伸或收缩所述解码音频信号。18.根据权利要求17所述的系统,其特征在于,所述时间扭曲逻辑通过最大化所述外插信号和所述解码音频信号之间的相关性来计算所述外插信号和所述解码音频信号之间的时滞。19.根据权利要求18所述的系统,其特征在于,所述时间扭曲逻辑用于通过搜索零附近±MAXOS的时滞范围内所述外插信号和所述解码音频信号之间的标准化交叉相关性函数R(k)的峰值来最大化所述外插信号和所述解码音频信号之间的相关性k=-MAXOS,K,MAXOS其中es是外插信号,x是解码语音信号,MAXOS是允许的最大偏移,LSW是滞后搜索窗口长度,i=0表示在滞后搜索窗口中的第一采样。20.根据权利要求17所述的系统,其特征在于,所述时间扭曲逻辑用于使用第一滞后搜索范围和第一滞后搜索窗口搜索所述外插信号与所述解码音频信号之间的标准化交叉相关性函数的第一峰值以确定粗时滞,其中所述第一滞后搜索范围是指在所述搜索过程中平移所述外插信号的起始点的范围,所述第一滞后搜索窗口是指计算所述标准化交叉相关性函数的采样数量;且所述时间扭曲逻辑用于使用第二滞后搜索范围和第二滞后搜索窗口搜索所述外插信号与所述解码音频信号之间的标准化交叉相关性函数的第二峰值以确定细化时滞,其中第二滞后搜索范围小于第一滞后搜索范围。21.根据权利要求20所述的系统,其特征在于,所述时间扭曲逻辑用于通过搜索所述外插信号与所述解码音频信号的向下采样样本之间的标准化交叉相关性函数的峰值来搜索所述外插信号与所述解码音频信号之间的标准化交叉相关性函数的第一峰值。22.根据权利要求20所述的系统,其特征在于,所述第二滞后搜索窗口小于第一滞后搜索窗口。23.根据权利要求20所述的系统,其特征在于,所述时间扭曲逻辑用于将所述第二滞后搜索窗口与所述接收帧的叠加区域的中心对齐。24.根据权利要求17所述的系统,其特征在于,所述时间扭曲逻辑用于部分地解码所述接收帧以产生所述解码音频信号的近似值并计算所述外插信号与所述解码音频信号的近似值之间的时滞...

【专利技术属性】
技术研发人员:罗伯塔W措普夫朱因韦陈杰斯赛森
申请(专利权)人:美国博通公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利