使用错误隐藏提供经解码的音频信息的音频解码器及方法技术

技术编号:13340915 阅读:215 留言:0更新日期:2016-07-13 16:35
一种用于基于经编码的音频信息(110;310)提供经解码的音频信息(112;312)的音频解码器(100;300)。音频解码器包含错误隐藏(130;380;500),错误隐藏用于使用时域激励信号(532)提供用于对以频域表示(322)编码的音频帧之后的音频帧的丢失进行隐藏的错误隐藏音频信息(132;382;512)。

【技术实现步骤摘要】
【国外来华专利技术】
根据本专利技术的实施例创造用于基于经编码的音频信息提供经解码的音频信息的音频解码器。根据本专利技术的一些实施例创造用于基于经编码的音频信息提供经解码的音频信息的方法。根据本专利技术的一些实施例创造用于执行所述方法中的一个的计算机程序。根据本专利技术的一些实施例涉及用于变换域编解码器的时域隐藏。
技术介绍
近年来,对音频内容的数字传输及储存的需求日益增加。然而,音频内容通常在不可靠声道上传输,这带来包含一个或多个音频帧(例如,以经编码的表示的形式,如(例如)经编码的频域表示或经编码的时域表示)的数据单元(例如,封包)丢失的风险。在一些情形下,将可能请求丢失的音频帧(或包含一个或多个丢失的音频帧的数据单元,如封包)的重复(重新发送)。然而,此通常将带来大量延迟,且将因此需要音频帧的扩展(extensive)缓冲。在其他情况下,几乎不可能请求丢失的音频帧的重复。为了获得良好的或至少可接受的音频品质,考虑到音频帧丢失而未提供扩展缓冲(这将消耗大量存储器且还将大体上使音频编码的实时能力降级)的情况,期望具有用以处理一个或多个音频帧的丢失的概念。特别地,期望具有甚至在音频帧丢失的情况下带来良好的音频品质或至少可接受的音频品质的概念。过去,已发展一些错误隐藏概念,这些错误隐藏概念可应用于不同的音频编码概念中。在下文中,将描述传统的音频编码概念。在3gpp标准TS26.290中,解释利用错误隐藏的变换编码激励解码(TCX解码)。在下文中,将提供一些解释,这些解释基于参考文献[1]中的章节“TCXmodedecodingandsignalsynthesis”。图7及图8中示出根据国际标准3gppTS26.290的TCX解码器,其中图7和图8示出TCX解码器的方块图。然而,图7示出在正常操作中或部分封包丢失的情况下与TCX解码有关的那些功能方块。相反,图8示出在TCX-256封包擦除隐藏的情况下的TCX解码的有关处理。不同而言,图7及图8示出包括遵循以下情况的TCX解码器的方块图:情况1(图8):当TCX帧长度为256个样本且有关封包丢失(即,BFI_TCX=(1))时的TCX-256中的封包擦除隐藏;以及情况2(图7):正常TCX解码,可能具有部分封包丢失。在下文中,将关于图7及图8提供一些解释。如所提及,图7示出在正常操作中或在部分封包丢失的情况下执行TCX解码的TCX解码器的方块图。根据图7的TCX解码器700接收TCX特定参数710,且基于该TCX特定参数提供经解码的音频信息712、714。音频解码器700包含多路解复用器“DEMUXTCX720”,该多路解复用器用于接收TCX特定参数710及信息“BFI_TCX”。多路解复用器720分离TCX特定参数710,并提供经编码的激励信息722、经编码的噪声填入(fill-in)信息724及经编码的全局增益信息726。音频解码器700包含激励解码器730,该激励解码器用于接收经编码的激励信息722、经编码的噪声填入信息724及经编码的全局增益信息726,以及一些额外信息(如,例如,比特率旗标“bit_rate_flag”、信息“BFI_TCX”及TCX帧长度信息。激励解码器730基于上述信息提供时域激励信号728(也以“x”指定)。激励解码器730包含激励信息处理器732,该激励信息处理器对经编码的激励信息722进行解复用并对代数向量量化参数进行解码。激励信息处理器732提供中间激励信号734,该中间激励信号通常是以频域表示,且以Y指定。激励编码器730还包含噪声注入器736,该噪声注入器用于在非量化子带中注入噪声,以从中间激励信号734导出噪声填充的激励信号738。噪声填充的激励信号738通常处于频域中,且以Z指定。噪声注入器736从噪声填入水平解码器740接收噪声强度信息742。激励解码器还包含适应性低频去加重744,该适应性低频去加重用于基于噪声填充的激励信号738执行低频去加重操作,以获得处理后的激励信号746,该处理后的激励信号仍处于频域中,且以X’指定。激励解码器730还包含频域至时域的变换器748,该频域至时域的变换器用于接收处理后的激励信号746,并基于该处理后的激励信号提供时域激励信号750,该时域激励信号与由频域激励参数的集合(例如,处理后的激励信号746的频域激励参数的集合)表示的某个时间部分相关联。激励解码器730还包含缩放器752,该缩放器用于对时域激励信号750进行缩放以获得经缩放的时域激励信号754。缩放器752从全局增益解码器758接收全局增益信息756,其中作为回复,全局增益解码器758接收经编码的全局增益信息726。激励解码器730还包含重叠-相加合成760,该重叠-相加合成接收与多个时间部分相关联的经缩放的时域激励信号754。重叠-相加合成760基于经缩放的时域激励信号754执行重叠及相加操作(该重叠及相加操作可包括开窗操作),以获得较长时间周期(比提供单独时域激励信号750、754的时间周期长)内的时间上组合的时域激励信号728。音频解码器700还包含LPC合成770,该LPC合成接收由重叠-相加合成760提供的时域激励信号728及定义LPC合成滤波函数772的一个或多个LPC系数。LPC合成770可例如包含第一滤波器774,该第一滤波器可例如对时域激励信号728进行合成滤波,以获得经解码的音频信号712。选择性地,LPC合成770还可包含第二合成滤波器772,该第二合成滤波器用于使用另一合成滤波函数对第一滤波器774的输出信号进行合成滤波,以获得经解码的音频信号714。在下文中,将在TCX-256封包擦除隐藏的情况下描述TCX解码。图8示出在此情况下的TCX解码器的方块图。封包擦除隐藏800接收音高(pitch)信息810,该音高信息也以“pitch_tcx”指定,且该音高信息是从在先经解码的TCX帧获得。例如,在激励解码器730中(在“正常”解码期间),可使用主(dominant)音高估计器747从处理后的激励信号746获得音高信息810。此外,封包擦除隐藏800接收LPC参数812,该LPC参数可表示LPC合成滤波函数。LPC参数812可例如与LPC参数772相同。因此,封包擦除隐藏800可用于基于音高信息810及LPC参数812提供错误隐藏信号814,该错误隐藏信号可被视为错误隐藏音频信息。封包擦除隐藏800包含激励缓冲器820,该激励缓冲器可例如缓冲在先激励。激励缓冲器820可例如利用ACELP的适应性码本,并可提供激励信号822。封包本文档来自技高网...

【技术保护点】
一种用于基于经编码的音频信息(110;310)提供经解码的音频信息(112;312)的音频解码器(100;300),所述音频解码器包含:错误隐藏(130;380;500),用于使用时域激励信号(532)提供用于对以频域表示(322)编码的音频帧之后的音频帧的丢失进行隐藏的错误隐藏音频信息(132;382;512)。

【技术特征摘要】
【国外来华专利技术】2013.10.31 EP EP13191133;2014.07.28 EP EP141788241.一种用于基于经编码的音频信息(110;310)提供经解码的音频信息(112;312)
的音频解码器(100;300),所述音频解码器包含:
错误隐藏(130;380;500),用于使用时域激励信号(532)提供用于对以频域表示(322)
编码的音频帧之后的音频帧的丢失进行隐藏的错误隐藏音频信息(132;382;512)。
2.根据权利要求1所述的音频解码器(100;300),其中所述音频解码器包含:
频域解码器核心(120;340,350,360,366,370),用于将基于比例因数的缩放360)
施加至从所述频域表示(322)导出的多个频谱值(342),且
其中所述错误隐藏(130;380;500)用于使用从所述频域表示导出的时域激励信号(532)
提供用于对以包含多个经编码的比例因数(328)的频域表示(322)编码的音频帧之后的
音频帧的丢失进行隐藏的错误隐藏音频信息(132;382;512)。
3.根据权利要求1或2所述的音频解码器(100;300),其中所述频域表示包含多个
频谱值的经编码的表示(326)以及用于对所述频谱值进行缩放的多个比例因数的经编码的
表示(328),或其中所述音频解码器用于从LPC参数的经编码的表示导出用于对所述频谱
值进行缩放的多个比例因数。
4.根据权利要求1-3中任一项所述的音频解码器(100;300),其中所述音频解码器
包含:
频域解码器核心(120;340,350,350,366,370),用于从所述频域表示(322)导
出时域音频信号表示(122;372)而不将时域激励信号用作以频域表示编码的音频帧的中
间量。
5.根据权利要求1-4中任一项所述的音频解码器(100;300),其中所述错误隐藏(130;
380;500)用于基于丢失的音频帧之前的以频域表示(322)编码的所述音频帧获得所述时
域激励信号(532),且
其中所述错误隐藏用于使用所述时域激励信号提供用于对所述丢失的音频帧进行隐藏
的错误隐藏音频信息(122;382;512)。
6.根据权利要求1-5中任一项所述的音频解码器(100;300),其中所述错误隐藏(130;
380;500)用于基于所述丢失的音频帧之前的以所述频域表示(322)编码的所述音频帧执
行LPC分析(530),以获得线性预测编码参数的集合以及所述时域激励信号(532),所述
时域激励信号表示所述丢失的音频帧之前的以所述频域表示编码的所述音频帧的音频内
容;或
其中所述错误隐藏(130;380;500)用于基于所述丢失的音频帧之前的以所述频域表

\t示(322)编码的所述音频帧执行LPC分析(530),以获得所述时域激励信号(532),所
述时域激励信号表示所述丢失的音频帧之前的以所述频域表示编码的所述音频帧的音频内
容;或
其中所述音频解码器用于使用线性预测编码参数估计而获得线性预测编码参数的集
合;或
其中所述音频解码器用于使用变换基于比例因数的集合获得线性预测编码参数的集
合。
7.根据权利要求1-6中任一项所述的音频解码器(100;300),其中所述错误隐藏(130;
380;500)用于获得描述所述丢失的音频帧之前的以频域表示编码的所述音频帧的音高的
音高信息(542),且依据所述音高信息提供所述错误隐藏音频信息(122;382;512)。
8.根据权利要求7所述的音频解码器(100;300),其中所述错误隐藏(130;380;
500)用于基于从所述丢失的音频帧之前的以频域表示(322)编码的所述音频帧导出的所
述时域激励信号532)获得所述音高信息(542)。
9.根据权利要求8所述的音频解码器(100;300),其中所述错误隐藏(130;380;
500)用于估计所述时域激励信号(532)或所述时域信号(522)的交叉相关,以确定粗略
的音高信息,且
其中所述错误隐藏用于使用围绕由所述粗略的音高信息确定的音高的闭回路搜索而细
化所述粗略的音高信息。
10.根据权利要求1-6中任一项所述的音频解码器,其中所述错误隐藏用于基于所述
经编码的音频信息的边信息获得音高信息。
11.根据权利要求1-6中任一项所述的音频解码器,其中所述错误隐藏用于基于可用
于先前解码的音频帧的音高信息获得音高信息。
12.根据权利要求1-6中任一项所述的音频解码器,其中所述错误隐藏用于基于对时
域信号或对残差信号执行的音高搜索而获得音高信息。
13.根据权利要求1-12中任一项所述的音频解码器(100;300),其中所述错误隐藏
(130;380;500)用于将从所述丢失的音频帧之前的以所述频域表示(322)编码的所述
音频帧导出的所述时域激励信号(532)的音高周期复制一次或多次,以便获得用于所述错
误隐藏音频信息(132;382;512)的合成(580)的激励信号(572)。
14.根据权利要求13所述的音频解码器(100;300),其中所述错误隐藏(130;380;
500)用于使用采样率相依滤波器对从所述丢失的音频帧之前的以所述频域表示(322)编
码的所述音频帧的所述时域表示导出的所述时域激励信号(532)的所述音高周期进行低通
滤波,所述采样率相依滤波器的带宽取决于以频域表示编码的所述音频帧的采样率。
15.根据权利要求1-14中任一项所述的音频解码器(100;300),其中所述错误隐藏
(130;380;500)用于预测在丢失帧的结束处的音高,且
其中所述错误隐藏用于使所述时域激励信号(532)或所述时域激励信号的一个或多个
副本适于所述预测的音高,以便获得用于LPC合成(580)的的输入信号(572)。
16.根据权利要求1-15中任一项所述的音频解码器(100;300),其中所述错误隐藏
(130;380;500)用于对外插的时域激励信号(552)及噪声信号(562)进行组合,以便
获得用于LPC合成(580)的输入信号(572),且
其中所述错误隐藏用于执行所述LPC合成,
其中所述LPC合成用于依据线性预测编码参数对所述LPC合成的所述输入信号(572)
进行滤波,以便获得所述错误隐藏音频信息(132;382;512)。
17.根据权利要求16所述的音频解码器(100;300),其中所述错误隐藏(130;380;
500)用于使用所述...

【专利技术属性】
技术研发人员:杰雷米·勒孔特格兰·马尔科维奇迈克尔·施纳贝尔格热戈日·派特拉维克
申请(专利权)人:弗朗霍夫应用科学研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1