用于对音频帧丢失隐藏进行控制的方法和设备技术

技术编号:19483291 阅读:18 留言:0更新日期:2018-11-17 10:57
根据本发明专利技术的实施例,所公开的是用于对接收音频信号的丢失音频帧的隐藏方法进行控制的方法和设备。解码器隐藏丢失音频帧的方法包括:在先前接收的和重构的音频信号的属性中或在所观察到的帧丢失的统计属性中检测丢失帧的替代提供相对降低的质量的条件。在检测到这种条件的情况下,通过选择性地调整替代帧谱的相位或谱幅度来修改所述隐藏方法。

【技术实现步骤摘要】
用于对音频帧丢失隐藏进行控制的方法和设备本申请是2014年1月22日提交的中国专利申请No.201480007552.3的专利技术名称为“用于对音频帧丢失隐藏进行控制的方法和设备”的分案申请。
本申请涉及对用于接收音频信号的丢失音频帧的隐藏方法进行控制的方法和设备。
技术介绍
传统音频通信系统用帧来传输语音和音频信号,意味着发送侧首先将信号设置为例如20=40ms的短的段,该段随后被编码并作为例如逻辑单元在传输分组中传输。接收机对这些单元中的每个单元进行解码,并且重构相应的信号帧,该信号帧进而最后输出为重构信号采样的连续序列。在编码之前,通常存在将来自麦克风的模拟语音或音频信号转换成音频采样序列的模数(A/D)转换步骤。相反地,在接收端,通常存在将重构的数字信号采样序列转换成用于扬声器重放的时间连续模拟信号的最终D/A转换步骤。然而,针对语音和音频信号的这种传输系统会受到传输错误的影响,这会导致传输帧中的一个或若干个在接收机处不可用于重构的情况。在那种情况下,解码器必须生成针对每个擦除的(即不可用的)帧的替代信号。这在接收机侧信号解码器的所谓的帧丢失或错误隐藏单元中完成。帧丢失隐藏的目的是使得尽可能听不到帧丢失,并且因此尽可能减轻帧丢失对重构信号质量造成的影响。传统的帧丢失隐藏方法可以取决于编解码器的构造或结构,例如通过应用之前接收的编解码器参数的重复的形式。这种参数重复技术显然取决于使用的编解码器的具体参数,并且因此不容易适用于具有不同构造的其它编解码器。当前的帧丢失隐藏方法可以(例如)应用对先前接收帧的参数进行冻结和外插(extrapolate)的概念,以生成丢失帧的替代帧。这些现有技术帧丢失隐藏方法包含一些突发丢失处理方案。通常,在接连多个帧丢失之后,合成的信号被衰减,直至在长的错误突发之后完全静音。此外,修改必须重复和推算的编码参数,以使衰减完成并使谱峰平滑掉。当前现有帧丢失隐藏技术通常应用冻结和外插之前接收的帧的参数,以生成丢失帧的替代帧。许多参变的(parametric)语音编解码器(如像是AMR或AMR-WB的线性预测编解码器)通常冻结早先接收的参数或使用其某一外插,并一起使用解码器。本质上,该原理是取得用于编码/解码的给定模型,并且将冻结或外插后的参数应用到同一模块上。AMR和AMR-WB的帧丢失隐藏技术可以被认为是代表性的。在相应标准规范中对它们进行了详细说明。音频编解码器类别中的很多编解码器用于编码频域技术。这意味着在一些频域变换之后,对谱参数应用编码模型。解码器根据接收参数来重构信号谱,并且最终将谱变换回时间信号。典型地,时间信号是逐帧重构的。这些帧通过重叠相加技术组合为最终的重构信号。甚至在音频编解码器的情况下,现有的错误隐藏针对丢失帧通常应用相同或至少部分类似的解码模型。来自之前接收的帧的频域参数被冻结或者适当地被外插,然后在频率到时间域转换中使用。这种技术的示例具备根据3GPP标准的3GPP音频编解码器。
技术实现思路
帧丢失隐藏的当前现有技术解决方案通常经受质量减损。主要问题在于:参数冻结和外插技术和甚至对于丢失帧的同一解码器模型的再应用并不能总是保证从之前解码后的信号帧到丢失帧的平滑和可靠的信号演变。这通常导致具有相应质量影响的可听信号中断。描述了用于语音和音频传输系统的帧丢失隐藏的新方案。新的方案提高了帧丢失情况下的质量,高于用现有的帧丢失隐藏技术可以获得的质量。本实施例的目的是对优选地具有所描述的相关新方法的类型的帧丢失隐藏方案进行控制,以实现重构信号的最佳可能声音质量。所述实施例旨在关于所述信号的属性和帧丢失时间分布的属性两方面对该重构质量进行优化。具体地,对于提供良好质量的帧丢失隐藏的问题是音频信号具有强烈变化的属性时的情况,例如能量起始(onset)或结束(offset),或者音频信号在谱上非常波动的情况。在那种情况下,所描述的隐藏方法会重复起始、结束或谱波动,导致距离原始信号的大偏差和相应的质量损失。另一种成问题的情况是如果接连发生帧丢失的突发。从概念上说,根据所描述的方法的帧丢失隐藏的方案可以处理这些情况,尽管结果是可能仍然发生恼人的音调上的人为损伤(tonalartifact)。本专利技术实施例的另一个目的是将这种人为损伤减轻到最大可能程度。根据第一方面,一种解码器用于隐藏丢失音频帧的方法包括:在先前接收的和重构的音频信号的属性中或在观察到的帧丢失的统计属性中检测丢失帧的替代提供相对降低的质量的条件。在检测到所述条件时,通过选择性地调整替代帧谱的相位或谱幅度来修改所述隐藏方法。根据第二方面,解码器被配置为实现对丢失音频帧的隐藏,并且包括控制器,该控制器被配置为:在先前接收的和重构的音频信号的属性中或在观察到的帧丢失的统计属性中检测丢失帧的替代提供相对降低的质量的条件。当检测到所述条件时,通过选择性地调整替代帧谱的相位或谱幅度来修改所述隐藏方法。解码器可以在设备(例如移动电话)中实现。根据第三方面,接收机包括根据上述第二方面的解码器。根据第四方面,一种计算机程序被定义为用来隐藏丢失音频帧,并且所述计算机程序包括指令,当处理器运行该指令时,使处理器如上述第一方面所述隐藏丢失音频帧。根据第五方面,计算机程序产品包括存储了根据上述第四方面的计算机程序的计算机可读介质。实施例的优点解决了对适配帧丢失隐藏方法的控制,所述控制允许减轻对编码语音和音频信号的传输中的帧丢失的听得见的影响,甚至超过仅用所描述的隐藏方法获得的质量。实施例的主要益处在于:提供了甚至对于丢失帧的重构信号的平滑且可靠的演变。与使用现有技术相比大大地减小了帧丢失的听得见的影响。附图说明为了更全面理解本专利技术的示例实施例,现在结合附图做出对于以下描述的参考,其中:图1示出了矩形窗函数。图2示出了Hamming窗与矩形窗的组合。图3示出了窗函数的幅度谱的示例。图4示出了具有频率fk的示例性正弦信号的线性谱;图5示出了具有频率fk的加窗的正弦信号谱;图6示出了基于分析帧的、与DFT的网格点的幅度相对应的条形图;图7示出了与DFT网格点P1、P2和P3拟合的抛物线;图8示出了窗谱的主瓣的拟合。图9示出了通过DFT网格点P1和P2的主瓣逼近函数P的拟合。图10是示出根据本专利技术实施例的用于控制针对接收音频信号的丢失帧的隐藏方法的一种示例方法的流程图。图11是示出根据本专利技术实施例的用于控制针对接收音频信号的丢失帧的隐藏方法的另一种示例方法的流程图。图12示出了本专利技术的另一个示例实施例。图13示出了根据本专利技术的装置的示例。图14示出了根据本专利技术的实施例的设备的另一个示例。图15示出了根据本专利技术的实施例的设备的另一个示例。具体实施方式所描述的对于新的帧丢失隐藏技术的新的控制方案包括图10中所示的以下步骤。应该注意的是,可以在解码器的控制器中实现该方法。1.在先前接收到的和重构的音频信号的属性中或在观察到的帧丢失的统计属性中检测根据所述方法的丢失帧的替换提供相对降低的质量的条件,101。2.在步骤1中检测到这种条件的情况下,修改方法的要素,根据该修改后的方法要素,通过选择性地调整相位或谱幅度,利用Z(m)=Y(m)·ejθk来计算替代帧谱,102。正弦分析可以应用新控制技术的帧丢失隐藏技术的第一步骤包括对先前接收信号的本文档来自技高网
...

【技术保护点】
1.一种帧丢失隐藏方法,其中来自先前接收或重构的音频信号的段被用作原型帧,以便为丢失的音频帧创建替代帧,所述方法包括:‑将原型帧变换到频域;‑分析先前重构的信号帧和帧丢失统计以检测预定条件,其中所述条件包括检测到的瞬态和具有若干连续帧丢失的突发丢失;‑如果未检测到所述条件,则应用第一隐藏方法,其中所述第一隐藏方法包括:将正弦模型应用于原型帧,以识别音频信号的正弦分量的频率,计算所述正弦分量的相移θk,并对所述正弦分量相位偏移θk;‑如果检测到所述条件,则应用第二隐藏方法,其中所述第二隐藏方法包括:通过选择性地调整原型帧的谱的幅度来调整所述第一隐藏方法;以及‑通过执行原型帧的频谱的逆频率变换来创建替代帧。

【技术特征摘要】
2013.02.05 US 61/761,051;2013.02.05 US 61/760,822;1.一种帧丢失隐藏方法,其中来自先前接收或重构的音频信号的段被用作原型帧,以便为丢失的音频帧创建替代帧,所述方法包括:-将原型帧变换到频域;-分析先前重构的信号帧和帧丢失统计以检测预定条件,其中所述条件包括检测到的瞬态和具有若干连续帧丢失的突发丢失;-如果未检测到所述条件,则应用第一隐藏方法,其中所述第一隐藏方法包括:将正弦模型应用于原型帧,以识别音频信号的正弦分量的频率,计算所述正弦分量的相移θk,并对所述正弦分量相位偏移θk;-如果检测到所述条件,则应用第二隐藏方法,其中所述第二隐藏方法包括:通过选择性地调整原型帧的谱的幅度来调整所述第一隐藏方法;以及-通过执行原型帧的频谱的逆频率变换来创建替代帧。2.根据权利要求1所述的方法,其中在应用所述第一隐藏方法时,所述原型帧的谱的幅度保持不变。3.根据权利要求1所述的方法,其中所述检测到的瞬态包括结束。4.根据权利要求1所述的方法,其中针对每个频带,频率选择性地执行瞬态检测。5.根据权利要求1所述的方法,其中频带选择性地执行选择性地调整原型帧的谱的幅度。6.根据权利要求1所述的方法,其中所述第二隐藏方法还包括通过添加随机分量来调整所述相移θk。7.根据权利要求6所述的方法,其中如果突发丢失计数器超过确定的阈值,则调整所述相移θk。8.根据权利要求7所述的方法,其中所述阈值是3。9.一种用于为丢失的音频帧创建替代帧的设备(134,136),所述设备包括:-用于根据先前接收或重构的音频信号的段生成原型帧的装置;-用于将原型帧变换到频...

【专利技术属性】
技术研发人员:斯蒂芬·布鲁恩乔纳斯·斯韦德贝里
申请(专利权)人:瑞典爱立信有限公司
类型:发明
国别省市:瑞典,SE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1