In one embodiment of the present invention, a method of decoding encoded audio bit streams and generating bandwidth extensions includes decoding the audio bit stream to produce decoded low band audio signals and generating a low band excitation spectrum corresponding to the low frequency band. The subband region is selected from the low frequency band using the parameter, indicating the energy information of the spectrum envelope of the decoded low band audio signal. The high band excitation spectrum of the high frequency band is generated by replicating the subband excitation spectrum from the selected subband region to the high subband region corresponding to the high frequency band. Using the generated high band excitation spectrum, an extended high band audio signal is generated by using a high band spectral envelope. The extended high band audio signal is added to the decoded low band audio signal to generate an audio output signal with an extended frequency bandwidth.
【技术实现步骤摘要】
自适应带宽扩展方法及其装置
本专利技术大体上涉及语音处理领域,尤其涉及自适应带宽扩展方法及其装置。
技术介绍
在现代音频/语音数字信号通信系统中,数字信号在编码器处被压缩,已压缩的信息(比特流)可以打包并且通过通信信道逐帧向解码器发送。编码器和解码器在一起的系统被称为编解码器。语音/音频压缩可以用来减少表示语音/音频信号的比特数,从而降低传输所需的比特率。语音/音频压缩技术大体上可以分类为时域编码和频域编码。时域编码通常用于编码低比特率的语音信号或音频信号。频域编码通常用于编码高比特率的音频信号或语音信号。带宽扩展(BWE)可以是时域编码或频域编码的一部分,用于以非常低的比特率或以零比特率生成高带信号。然而,语音编码器是有损编码器,即,解码得到信号不同于原始信号。因此,语音编码的目标之一是为了使失真(或可感知损失)在给定比特率下最小化,或者使比特率最小化以达到给定的失真。语音编码与其它形式的音频编码的不同之处在于语音是一种比大多数其它音频信号简单地多的信号,而且关于语音特性的统计信息更多。因此,与音频编码相关的一些听觉信息在语音编码上下文中可以是不必要的。在语音编码中,最重要的标准是在传输的数据量受限的情况下保持语音的清晰度和“愉悦度”。语音的清晰度,除了包括实际文字内容,还包括说话者身份、情绪、语调、音色,所有这些对于最佳清晰度都很重要。受损语音的愉悦度是一个较抽象的概念,它不同于清晰度的一个特性,因为退化语音有可能是完全清晰的,但是主观上另听众厌烦。语音波形的冗余与不同类型的语音信号有关,例如浊音和清音语音信号。浊音,例如‘a’、‘b’,基本上是由于声 ...
【技术保护点】
一种对已编码音频比特流进行解码和生成频带扩展的方法,其特征在于,所述方法包括:解码所述音频比特流以产生已解码低带音频信号和生成对应于低频带的低带频谱;使用指示所述已解码低带音频信号的频谱包络的能量信息的参数从所述低频带内确定子带区域,其中,确定的所述子带区域的起始点对应于搜索范围内的频谱包络的的能量峰值,所述搜索范围为所述低频带内的一个频率区间;;通过从所述子带区域复制子带频谱到高子带区域以生成高带激励频谱;使用生成的所述高带激励频谱生成扩展的高带音频信号。
【技术特征摘要】
2013.09.10 US 61/875,690;2014.09.05 US 14/478,8391.一种对已编码音频比特流进行解码和生成频带扩展的方法,其特征在于,所述方法包括:解码所述音频比特流以产生已解码低带音频信号和生成对应于低频带的低带频谱;使用指示所述已解码低带音频信号的频谱包络的能量信息的参数从所述低频带内确定子带区域,其中,确定的所述子带区域的起始点对应于搜索范围内的频谱包络的的能量峰值,所述搜索范围为所述低频带内的一个频率区间;;通过从所述子带区域复制子带频谱到高子带区域以生成高带激励频谱;使用生成的所述高带激励频谱生成扩展的高带音频信号。2.根据权利要求1所述的方法,其特征在于,所述指示所述已解码低带音频信号的频谱包络的能量信息的参数为反映所述频谱包络的最高能量或频谱共振峰峰值的参数。3.根据权利要求1或2所述的方法,其特征在于,所述子带区域的起始点是通过搜索所述搜索范围内的频谱包络的最高能量点确定的。4.根据权利要求1至3任一项所述的方法,其特征在于,所述子带区域的位置对应于最高频谱峰值的位置。5.根据权利要求1或2所述的方法,其特征在于,所述从所述低频带内确定所述子带区域包括:从多个候选子带中搜索具有最高能量的子带,并确定所述具有最高能量的子带为所述子带区域。6.根据权利要求1至5任一项所述的方法,其特征在于,所述搜索范围取决于编解码器比特率。7.根据权利要求6所述的方法,其特征在于,所述编解码器比特率越高,则所述搜索范围越小。8.根据权利要求1至7任一项所述的方法,其特征在于,确定的所述子带区域的带宽与所述高子带区域的带宽相同。9.根据权利要求1至8任一项所述的方法,其特征在于,还包括:利用所述扩展的高带音频信号和所述已解码低带音频信号生成具有扩展的频率带宽的音频输出信号。10.根据权利要求1至9任一项所述的方法,其特征在于,所述使用生成的所述高带激励频谱生成扩展的高带音频信号包括:使用表示高带频域包络的预测的高带滤波器对所述高带激励频谱进行滤波,以获得所述扩展的高带音频信号。11.一种解码器,其特征在于,包括:低带解码单元,用于对音频比特流进行解码以产生已解码低带音频信号和生成对应低频带的低频带激励频谱;以及带宽扩展单元,耦合到所述低带解码单元并...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。