音频编码方法及相关装置制造方法及图纸

技术编号:16758083 阅读:31 留言:0更新日期:2017-12-09 03:28
本发明专利技术实施例提供了一种音频编码方法以及相关装置。一种音频编码方法,包括:估计当前音频帧的参考线性预测效率;确定与上述当前音频帧的参考线性预测效率匹配的音频编码方式;按照与上述当前音频帧的参考线性预测效率匹配的音频编码方式对上述当前音频帧进行音频编码。本发明专利技术实施例提供的技术方案有利于降低音频编码的开销。

Audio coding method and related devices

An audio coding method and a related device are provided in the embodiment of the invention. Including an audio encoding method, the linear reference: estimation of the audio frame prediction efficiency; determine the reference and the current linear audio frame prediction of audio encoding efficiency, according to the current reference; linear and audio frame prediction encoding efficiency, audio type audio encoding of the current audio frame. The technical scheme provided by the embodiment of the invention is beneficial to reduce the overhead of audio coding.

【技术实现步骤摘要】
音频编码方法及相关装置
本专利技术涉及音频编码技术,具体涉及音频编码方法及相关装置。
技术介绍
在过去相当长一段时期内,语音信号的编码和非语音信号(如音乐)的编码都是相对独立的,即语音信号的编码由专门的语音编码器实现,而非语音信号的编码由专门的非语音编码器(其中,非语音编码器也可称之为一般音频编码器)来实现。其中,语音编码器一般不用来编码非语音信号,非语音编码器一般也不被用来编码语音信号,这不仅仅是因为语音编码和非语音信号编码在编码理论上的相对独立,也是因为这两种信号在实际应用中通常相对独立。例如在话音通信网络中,由于过去很长一段时间内,话音都是全部或主要的信源,且带宽限制严格,所以在话音通信网络中各种低速率的语音编码器被大量的使用。而在影音、娱乐等应用中,由于非语音信号占据信源的大多数且出于这些应用对音频质量的相对较高要求和码率的相对宽松,在这些场景下非语音编码器被大量的使用。近些年,在传统的话音通信网络中出现了越来越多的多媒体信源,例如彩铃等等。这对编码器的编码质量提出了更高的要求,专门的语音编码器已不能提供这些多媒体信号所需的较高编码质量,新的编码技术如混合音频编码器应运而生。其中,所谓混合音频编码器,即一个音频编码器中既包含有适合编码语音信号的子编码器,也包含有适合编码非语音信号的子编码器。其中,混合音频编码器总是试图在所有子编码器中动态的选择最适合的一个子编码器对输入音频信号进行编码。其中,如何从所有子编码器中选出最适合的一个子编码器来对输入的当前音频帧进行编码,是混合编码器的一个重要功能和要求,对子编码器的选择也叫模式选择,这将直接关系到混合编码器的编码质量好坏。现有技术一般采用闭环模式选择子编码器,即每个子编码器都用来对输入的当前音频帧进行一次编码,通过直接比较编码后的当前音频帧的质量好坏来选择最优的子编码器。但是,闭环模式选择的缺点是使得编码运算复杂度相对很高(因为每个子编码器都用来对输入的当前音频帧进行一次编码),进而使得实际音频编码的开销变得较大。
技术实现思路
本专利技术实施例提供了一种音频编码方法以及相关装置,以期降低音频编码的开销。本专利技术实施例第一方面提供一种音频编码方法,包括:估计当前音频帧的参考线性预测效率;确定与所述当前音频帧的参考线性预测效率匹配的音频编码方式;按照与所述当前音频帧的参考线性预测效率匹配的音频编码方式对所述当前音频帧进行音频编码。结合第一方面,在第一方面的第一种可能的实施方式中,所述参考线性预测效率包括如下线性预测效率的至少一种:参考长时线性预测效率、参考短时线性预测效率和参考综合线性预测效率。结合第一方面的第一种可能的实施方式,在第一方面的第二种可能的实施方式中,所述参考综合线性预测效率为所述参考长时线性预测效率和所述参考短时线性预测效率的和值、加权和值或平均值。结合第一方面的第一种可能的实施方式,在第一方面的第三种可能的实施方式中,若所述当前音频帧的参考线性预测效率包括所述当前音频帧的参考长时线性预测效率和所述当前音频帧的参考短时线性预测效率,则所述确定与所述当前音频帧的参考线性预测效率匹配的音频编码方式,包括:若所述当前音频帧的参考长时线性预测效率小于第一阈值,和/或所述当前音频帧的参考短时线性预测效率小于第二阈值,则确定出与所述当前音频帧的参考线性预测效率匹配的音频编码方式为非基于线性预测的音频编码方式;和/或,若所述当前音频帧的参考长时线性预测效率大于或等于第一阈值,和/或所述当前音频帧的参考短时线性预测效率大于或等于第二阈值,则确定出与所述当前音频帧的参考线性预测效率匹配的音频编码方式为基于线性预测的音频编码方式。结合第一方面的第一种可能的实施方式,在第一方面的第四种可能的实施方式中,若所述当前音频帧的参考线性预测效率包括所述当前音频帧的参考长时线性预测效率,则所述确定与所述当前音频帧的参考线性预测效率匹配的音频编码方式,包括:若所述当前音频帧的参考长时线性预测效率大于或等于第三阈值,则确定出与所述当前音频帧的参考线性预测效率匹配的音频编码方式为基于线性预测的音频编码方式;和/或,若所述当前音频帧的参考长时线性预测效率小于第四阈值,则确定出与所述当前音频帧的参考线性预测效率匹配的音频编码方式为非基于线性预测的音频编码方式。结合第一方面的第一种可能的实施方式,在第一方面的第五种可能的实施方式中,若所述当前音频帧的参考线性预测效率包括所述当前音频帧的参考长时线性预测效率,则所述确定与所述当前音频帧的参考线性预测效率匹配的音频编码方式,包括:确定所述当前音频帧的参考长时线性预测效率所落入的第一线性预测效率区间,根据线性预测效率区间和基于线性预测的音频编码方式之间的映射关系,确定出与所述第一线性预测效率区间具有映射关系的第一音频编码方式,其中,所述第一音频编码方式为与所述当前音频帧的参考线性预测效率匹配的音频编码方式,所述第一音频编码方式为基于线性预测的音频编码方式或为非基于线性预测的音频编码方式。结合第一方面的第一种可能的实施方式,在第一方面的第六种可能的实施方式中,若所述当前音频帧的参考线性预测效率包括所述当前音频帧的参考短时线性预测效率,则所述确定与所述当前音频帧的参考线性预测效率匹配的音频编码方式,包括:若所述当前音频帧的参考短时线性预测效率大于或等于第五阈值,则确定出与所述当前音频帧的参考线性预测效率匹配的音频编码方式为基于线性预测的音频编码方式;和/或,若所述当前音频帧的参考短时线性预测效率小于第五阈值,则确定出与所述当前音频帧的参考线性预测效率匹配的音频编码方式为非基于线性预测的音频编码方式。结合第一方面的第一种可能的实施方式,在第一方面的第七种可能的实施方式中,若所述当前音频帧的参考线性预测效率包括所述当前音频帧的参考短时线性预测效率,则所述确定与所述当前音频帧的参考线性预测效率匹配的音频编码方式,包括:确定所述当前音频帧的参考短时线性预测效率所落入的第二线性预测效率区间,根据线性预测效率区间和基于线性预测的音频编码方式之间的映射关系,确定出与所述第二线性预测效率区间具有映射关系的第二音频编码方式,其中,所述第二音频编码方式为与所述当前音频帧的参考线性预测效率匹配的音频编码方式,所述第二音频编码方式为基于线性预测的音频编码方式或为非基于线性预测的音频编码方式。结合第一方面的第一种可能的实施方式或第一方面的第二种可能的实施方式,在第一方面的第八种可能的实施方式中,若所述当前音频帧的参考线性预测效率包括所述当前音频帧的参考综合线性预测效率,则所述确定与所述当前音频帧的参考线性预测效率匹配的音频编码方式,包括:若所述当前音频帧的参考综合线性预测效率大于或等于第六阈值,则确定出与所述当前音频帧的参考线性预测效率匹配的音频编码方式为基于线性预测的音频编码方式;和/或,若所述当前音频帧的参考综合线性预测效率小于第六阈值,则确定出与所述当前音频帧的参考线性预测效率匹配的音频编码方式为非基于线性预测的音频编码方式。结合第一方面的第一种可能的实施方式或第一方面的第二种可能的实施方式,在第一方面的第九种可能的实施方式中,若所述当前音频帧的参考线性预测效率包括所述当前音频帧的参考综合线性预测效率,则所述确定与所述当前音频帧的参考线性预测效率匹配的音频编本文档来自技高网
...
音频编码方法及相关装置

【技术保护点】
一种音频编码方法,其特征在于,包括:当当前音频帧为非语音音频帧时,估计所述当前音频帧的参考线性预测效率;确定与所述当前音频帧的参考线性预测效率匹配的音频编码方式;按照与所述当前音频帧的参考线性预测效率匹配的音频编码方式对所述当前音频帧进行音频编码。

【技术特征摘要】
1.一种音频编码方法,其特征在于,包括:当当前音频帧为非语音音频帧时,估计所述当前音频帧的参考线性预测效率;确定与所述当前音频帧的参考线性预测效率匹配的音频编码方式;按照与所述当前音频帧的参考线性预测效率匹配的音频编码方式对所述当前音频帧进行音频编码。2.根据权利要求1所述的方法,其特征在于,所述参考线性预测效率包括如下线性预测效率的至少一种:参考长时线性预测效率、参考短时线性预测效率和参考综合线性预测效率。3.根据权利要求2所述的方法,其特征在于,若所述当前音频帧的参考线性预测效率包括所述当前音频帧的参考短时线性预测效率,则所述确定与所述当前音频帧的参考线性预测效率匹配的音频编码方式,包括:若所述当前音频帧的参考短时线性预测效率大于或等于第五阈值,则确定出与所述当前音频帧的参考线性预测效率匹配的音频编码方式为基于线性预测的音频编码方式;和/或,若所述当前音频帧的参考短时线性预测效率小于第五阈值,则确定出与所述当前音频帧的参考线性预测效率匹配的音频编码方式为非基于线性预测的音频编码方式。4.根据权利要求2所述的方法,其特征在于,若所述当前音频帧的参考线性预测效率包括所述当前音频帧的参考短时线性预测效率,则所述确定与所述当前音频帧的参考线性预测效率匹配的音频编码方式,包括:确定所述当前音频帧的参考短时线性预测效率所落入的第二线性预测效率区间,根据线性预测效率区间和基于线性预测的音频编码方式之间的映射关系,确定出与所述第二线性预测效率区间具有映射关系的第二音频编码方式,其中,所述第二音频编码方式为与所述当前音频帧的参考线性预测效率匹配的音频编码方式,所述第二音频编码方式为基于线性预测的音频编码方式或为非基于线性预测的音频编码方式。5.根据权利要求2至4任一项所述的方法,其特征在于,所述当前音频帧的参考短时线性预测效率通过如下方式估计得到:估计当前音频帧的短时线性预测效率,其中,所述当前音频帧的短时线性预测效率为所述当前音频帧的参考短时线性预测效率;或者,所述当前音频帧的参考短时线性预测效率通过如下方式估计得到:估计得到当前音频帧的短时线性预测效率;获取所述当前音频帧的N5个历史音频帧的线性预测效率;计算所述N5个历史音频帧的线性预测效率和所述当前音频帧的短时线性预测效率的第四统计值,其中,所述N5为正整数,所述第四统计值为所述当前音频帧的参考短时线性预测效率,其中,N51个历史音频帧中的每个历史音频帧的线性预测效率为如下线性预测效率中的至少一种:长时线性预测效率、短时间线性预测效率和综合线性预测效率,所述N51个历史音频帧为所述N5个历史音频帧的子集;或者,所述当前音频帧的参考短时线性预测效率通过如下方式估计得到:估计得到当前音频帧的短时线性预测效率;获取所述当前音频帧的N6个历史音频帧的参考线性预测效率;计算所述N6个历史音频帧的参考线性预测效率和所述当前音频帧的短时线性预测效率的第五统计值,其中,所述N6为正整数,所述第五统计值为所述当前音频帧的参考短时线性预测效率,其中,N61个历史音频帧中的每个历史音频帧的参考线性预测效率为如下线性预测效率中的至少一种:参考长时线性预测效率、参考短时间线性预测效率和参考综合线性预测效率,其中,所述N61个历史音频帧为所述N6个历史音频帧的子集;或者,所述当前音频帧的参考短时线性预测效率通过如下方式估计得到:估计得到当前音频帧的短时线性预测效率;获取所述当前音频帧的N8个历史音频帧的参考线性预测效率;获取所述当前音频帧的N7个历史音频帧的线性预测效率;计算所述N7个历史音频帧的线性预测效率、所述N8个历史音频帧的参考线性预测效率和所述当前音频帧的短时线性预测效率的第六统计值,其中,所述N7和所述N8为正整数,所述第六统计值为所述当前音频帧的参考短时线性预测效率,N71个历史音频帧中的每个历史音频帧的线性预测效率为如下线性预测效率中的至少一种:长时线性预测效率、短时间线性预测效率和综合线性预测效率,N81个历史音频帧中的每个历史音频帧的参考线性预测效率为如下线性预测效率中的至少一种:参考长时线性预测效率、参考短时间线性预测效率和参考综合线性预测效率,其中,所述N71个历史音频帧为所述N7个历史音频帧的子集,所述N81个历史音频帧为所述N8个历史音频帧的子集。6.根据权利要求5所述的方法,其特征在于,所述估计得到当前音频帧的短时线性预测效率,包括:基于当前音频帧的线性预测残差得到当前音频帧的短时线性预测效率。7.根据权利要求6所述的方法,其特征在于,所述基于当前音频帧的线性预测残差得到当前音频帧的短时线性预测效率,包括:计算当前音频帧进行短时线性预测前后的能量变化率,其中,所述能量变化率为所述当前音频帧的短时线性预测效率,或者所述当前音频帧的短时线性预测效率基于所述能量变化率变换得到,其中,所述当前音频帧进行短时线性预测后的能量为所述当前音频帧的线性预测残差的能量。8.根据权利要求7所述的方法,其特征在于,所述当前音频帧进行短时线性预测前后的能量变化率为所述当前音频帧进行短时线性预测前的能量与所述当前音频帧的线性预测残差的能量的比值。9.一种音频编码器,其特征在于,包括:估计单元,用于当当前音频帧为非语...

【专利技术属性】
技术研发人员:王喆
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1