音频解码方法技术

技术编号:9061259 阅读:102 留言:0更新日期:2013-08-22 00:26
提供了一种音频解码方法。所述编码设备包括:变换与模式确定单元,将输入音频信号划分成多个频域信号,并为各个频域信号选择基于时间的编码模式或基于频率的编码模式;编码单元,以各个编码模式对每个频域信号进行编码;比特流输出单元,为每个编码的频域信号输出编码的数据、划分信息和编码模式信息。在所述设备和方法中,声学特性和语音模型被同时应用于作为音频压缩处理单位的帧。结果,可产生对音乐和语音均有效的压缩方法,并且该压缩方法可用于要求低比特率的音频压缩的移动终端。

【技术实现步骤摘要】
音频解码方法本申请是申请日为2006年11月8日、申请号为200680041592.5、题为“自适应的基于时间/频率的音频编码和解码设备和方法”的专利申请的分案申请。
本专利技术总体构思涉及音频编码和解码设备和方法,更具体地讲,涉及这样的自适应的基于时间/频率的音频编码和解码设备和方法,所述设备和方法可通过有效地利用两种编码方法的编码增益来获得高压缩效率,其中,对输入音频数据执行频域变换,从而,对适合于语音压缩的音频数据的频段执行基于时间的编码,并对音频数据的其余频段执行基于频率的编码。
技术介绍
传统的语音/音乐压缩算法大致可分为音频编解码算法和语音编解码算法。音频编解码算法(如aacPlus)对频域信号进行压缩,并应用心理声学模型。假设音频编解码和语音编解码对具有相等数据量的语音信号进行压缩,则音频编解码算法输出具有比语音编解码算法明显低许多的质量的声音。具体地讲,从音频编解码算法输出的声音的质量更多地受到攻击信号的不利影响。语音编解码算法(如,自适应多比率的宽带编解码(AMR-WB))对时域信号进行压缩,并应用语音模型。假设语音编解码和音频编解码对具有相等数据量的语音信号进行压缩,则语音编解码算法输出具有比音频编解码算法明显低许多的质量的声音。
技术实现思路
技术问题AMR-WBplus算法考虑了传统的语音/音乐压缩算法的上述特点以有效地执行语音/音乐压缩。在AMR-WBplus算法中,代数码激励线性预测(ACELP)算法用作语音压缩算法,和Tex字符转换(TCX)算法用作音频压缩算法。具体地讲,AMR-WBplus算法确定是否将ACELP算法或TCX算法应用于每个处理单元(例如,时间轴上的每一帧),然后相应地执行编码。在这种情况下,AMR-WBplus算法在对与语音信号接近的信号进行压缩时是有效的。然而,当AMR-WBplus算法用于对与音频信号接近的信号进行压缩时,由于AMR-WBplus算法以处理单位执行编码,所以音质或压缩率便下降。技术方案本专利技术总体构思提供这样的自适应的基于时间/频率的音频编码和解码设备和方法,所述设备和方法可通过有效地利用两种编码方法的编码增益来获得高压缩效率,其中,对输入音频数据执行频域变换,从而,对适合于语音压缩的音频数据的频段执行基于时间的编码,并对音频数据的其余频段执行基于频率的编码。本专利技术总体构思的另外方面将在下面的描述中部分地阐明,并且从描述中部分是清楚的,或者通过本专利技术的实施可以被理解。通过提供一种自适应的基于时间/频率的音频编码设备来实现本专利技术总体构思的上述和/或另外方面以及效用。所述编码设备包括:变换与模式确定单元,将输入音频信号划分成多个频域信号,并为各个频域信号选择基于时间的编码模式或基于频率的编码模式;编码单元,以由变换与模式确定单元选择的各个编码模式对每个频域信号进行编码;比特流输出单元,为每个编码的频域信号输出编码的数据、划分信息和编码模式信息。变换与模式确定单元可包括:频域变换单元,将输入音频信号变换为全频域信号;编码模式确定单元,根据预设标准将全频域信号划分成频域信号,并为每个频域信号确定基于时间的编码模式或基于频率的编码模式。可基于频谱倾斜、每个频域的信号能量的大小、子帧之间的信号能量的变化、以及语音水平确定中的至少一个,将全频域信号划分成适合于基于时间的编码模式或基于频率的编码模式的频域信号,并相应地为每个频域信号确定各个编码模式。所述编码单元可包括:基于时间的编码单元,对被确定为以基于时间的编码模式编码的第一频域信号执行逆频域变换,并对已被执行了逆频域变换的第一频域信号执行基于时间的编码;基于频率的编码单元,对被确定为以基于频率的编码模式编码的第二频域信号执行基于频率的编码。所述基于时间的编码单元可基于线性编码增益、相邻帧的线性预测滤波器之间的频谱变化、预测的音高延迟、以及预测的长期预测增益中的至少一个,为第一输入频域信号选择编码模式,当基于时间的编码单元确定基于时间的编码模式是适合于所述第一频域信号时,基于时间的编码单元继续对所述第一频域信号执行基于时间的编码,当基于时间的编码单元确定基于频率的编码模式适合于所述第一频域信号时,则基于时间的编码单元停止对所述第一频域信号执行基于时间的编码并将模式转换控制信号发送到变换与模式确定单元,变换与模式确定单元可响应于模式转换控制信号将被提供给基于时间的编码单元的所述第一频域信号输出到基于频率的编码单元。频域变换单元可使用变频调制重叠变换(MLT)执行频域变换。基于时间的编码单元可对从线性预测获得的残余信号进行量化,并根据重要性动态地将比特分配给量化的残余信号。基于时间的编码单元可将从线性预测获得的残余信号变换为频域信号,对所述频域信号进行量化,并根据重要性动态地将比特分配给量化的信号。可基于语音模型确定所述重要性。所述基于频率的编码单元可根据心理声学模型确定输入频域信号的量化步长大小,并对频域信号进行量化。基于频率的编码单元可根据心理声学模型从输入频域信号中提取重要频率组成部分,对提取的重要频率组成部分进行编码,并使用噪声建模对其余信号进行编码。可使用代码激励线性预测(CELP)算法获得所述残余信号。还通过提供一种音频数据编码设备来实现本专利技术总体构思的上述和/或另外方面以及效用。所述音频数据编码设备包括:变换与模式确定单元,将一帧音频数据划分成第一音频数据和第二音频数据;编码单元,在时域中对第一音频数据进行编码,在频域中对第二音频数据进行编码。还通过提供一种自适应的基于时间/频率的音频解码设备来实现本专利技术总体构思的上述和/或另外方面以及效用。所述解码设备包括:比特流分类单元,从输入比特流提取每个频段的编码的数据、划分信息、以及每个频段的编码模式信息;解码单元,基于划分信息和各个编码模式信息对每个频域的编码的数据进行解码;收集与逆变换单元,收集频域中的解码的数据,并对收集的数据执行逆频域变换。所述解码单元可包括:基于时间的解码单元,基于划分信息和各个第一编码模式信息对第一编码的数据执行基于时间的解码;基于频率的解码单元,基于划分信息和各个第二编码模式信息对第二编码的数据执行基于频率的解码。收集与逆变换单元可在频域中对解码的数据执行包络平滑,然后对解码的数据执行逆频域变换,从而解码的数据在频域中保持连续性。还通过提供一种音频数据解码设备来实现本专利技术总体构思的上述和/或另外方面以及效用,所述解码设备包括:比特流分类单元,提取帧的编码的音频数据;解码单元,将帧的音频数据解码为时域中的第一音频数据和频域中的第二音频数据。还通过提供一种自适应的基于时间/频率的音频编码方法来实现本专利技术总体构思的上述和/或另外方面以及效用,所述编码方法包括:将输入音频信号划分成多个频域信号,并为各个频域信号选择基于时间的编码模式或基于频率的编码模式;以各个编码模式对每个频域信号进行编码;输出每个频域信号的编码的数据、划分信息和编码模式信息。还通过提供一种音频数据编码方法来实现本专利技术总体构思的上述和/或另外方面以及效用,所述编码方法包括:将一帧音频数据划分成第一音频数据和第二音频数据;在时域中对第一音频数据进行编码,在频域中对第二音频数据进行编码。还通过提供一种自适应的基于时间/频率的音频解码方法来实现本专利技术总体构本文档来自技高网...
音频解码方法

【技术保护点】
一种音频解码方法,包括:从输入比特流提取编码的数据;基于编码的数据的模式信息在第一域中通过使用具有至少长期预测的代码激励线性预测CELP来对第一编码的数据进行解码;基于模式信息在第二域中通过使用高级音频编码AAC来对第二编码的数据进行解码;对在第二域中解码的数据进行逆变换;产生包括逆变换的数据和在第一域中解码的结果的信号。

【技术特征摘要】
2005.11.08 KR 10-2005-01063541.一种音频解码方法,包括:从输入比特流提取编码的数据和编码模式信息;基于编码模式信息,在时域中通过使用具有至少长...

【专利技术属性】
技术研发人员:金重会吴殷美孙昌用朱基岘
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1