立体声编码方法及立体声编码器技术

技术编号:18427986 阅读:25 留言:0更新日期:2018-07-12 02:22
本发明专利技术公开了立体声编码方法及立体声编码器,在进行立体声编码时,先确定了当前帧的声道组合编码方案,然后根据确定的声道组合编码方案获得当前帧的量化后的声道组合比例因子和量化后的声道组合比例因子的编码索引,从而提升编码质量。

【技术实现步骤摘要】
立体声编码方法及立体声编码器
本专利技术涉及音频编解码技术,具体涉及立体声编码方法及立体声编码器。
技术介绍
随着生活质量的提高,人们对高质量音频的需求不断增大。相对于单声道音频,立体声音频具有各声源的方位感和分布感,能够提高信息的清晰度、可懂度及临场感,因而备受人们青睐。时域立体声编解码技术是现有的一种常用的立体声编解码技术。现有的时域立体声编码技术,通常是在时域将输入信号下混为两路单声道信号,例如和/差(M/S:Mid/Sid)编码方法。先将左右声道下混为中央通道(Midchannel)以及边通道(Sidechannel),其中Midchannel为0.5*(L+R),表征了两个声道之间的相关信息;Sidechannel为0.5*(L-R),表征了两个声道之间的差异信息;其中,L表示左声道信号,R表示右声道信号。然后,分别对Midchannel信号及Sidechannel信号采用单声道编码方法进行编码。对于Midchannel信号,通常用较多的比特数进行编码;对于Sidechannel信号,通常用较少的比特数进行编码。现有的立体声编码方法在对立体声音频信号进行编码时,不考虑立体声音频信号的信号类型,会导致编码后的合成立体声音频信号的声像不稳,有漂移现象,编码质量有提升的空间。
技术实现思路
本专利技术实施例提供了立体声编码方法及立体声编码器,能够根据立体声音频信号的信号类型选择不同的编码方式,从而提升编码质量。本专利技术的第一方面提供了一种立体声编码方法,包括:对立体声音频信号的当前帧的左声道时域信号和右声道时域信号进行时域预处理,以获得所述当前帧的预处理后的左声道时域信号和预处理后的右声道时域信号;其中,时域预处理可以包括滤波处理,具体可以是高通滤波处理;对所述当前帧的预处理后的左声道时域信号和预处理后的右声道时域信号进行时延对齐处理,以获得所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号;根据所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号确定所述当前帧的声道组合方案;其中,声道组合方案可以包括类正相信号声道组合方案或类反相信号声道组合方案;根据确定的所述当前帧的声道组合方案,所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号,获得所述当前帧的量化后的声道组合比例因子和所述量化后的声道组合比例因子的编码索引;类正相信号声道组合方案和类反相信号声道组合方案对应的获得量化后的声道组合比例因子和所述量化后的声道组合比例因子的编码索引的方法不相同。根据确定的所述当前帧的声道组合方案,确定所述当前帧的编码模式;根据所述当前帧的编码模式和所述当前帧的量化后的声道组合比例因子,对所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号进行下混处理,以获得所述当前帧的主要声道信号和次要声道信号;对所述当前帧的主要声道信号和次要声道信号进行编码。结合第一方面,在第一方面的一种实施方式中,所述根据所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号确定所述当前帧的声道组合方案包括:根据所述当前帧时延对齐后的左声道时域信号和时延对齐后的右声道时域信号确定所述当前帧的信号类型,所述信号类型包括类正相信号或类反相信号;至少根据所述当前帧的信号类型对应确定所述当前帧的声道组合方案,所述声道组合方案包括用于处理类反相信号的类反相信号声道组合方案或用于处理类正相信号的类正相信号声道组合方案。结合第一方面或者第一方面的任意一种实施方式,在第一方面的一种实施方式中,如果所述当前帧的声道组合方案为用于处理类反相信号的类反相信号声道组合方案;所述根据确定的所述当前帧的声道组合方案,所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号,获得所述当前帧的量化后的声道组合比例因子和所述量化后的声道组合比例因子的编码索引包括:根据所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号,获得所述当前帧的长时平滑后的左声道时域信号与所述当前帧的长时平滑后的右声道时域信号之间的幅度相关性差异参数;将所述幅度相关性差异参数转换为所述当前帧的声道组合比例因子;对所述当前帧的声道组合比例因子进行量化,以获得所述当前帧的量化后的声道组合比例因子以及所述量化后的声道组合比例因子的编码索引。结合第一方面或者第一方面的任意一种实施方式,在第一方面的一种实施方式中,所述将所述幅度相关性差异参数转换为所述当前帧的声道组合比例因子包括:对所述幅度相关性差异参数进行映射处理,以获得映射后的幅度相关性差异参数,所述映射后的幅度相关性差异参数的取值处于预设的幅度相关性差异参数取值范围;将所述映射后的幅度相关性差异参数转换为所述当前帧的声道组合比例因子。结合第一方面或者第一方面的任意一种实施方式,在第一方面的一种实施方式中,所述对所述幅度相关性差异参数进行映射处理包括:对所述幅度相关性差异参数进行限幅处理,以获得限幅处理后的幅度相关性差异参数;所述的限幅处理可以为分段限幅处理或非分段限幅处理,以及所述的限幅处理可以为线性限幅处理或非线性限幅处理;对所述限幅处理后的幅度相关性差异参数进行映射处理,从而获得所述映射后的幅度相关性差异参数;所述的映射处理可以为分段映射处理或非分段映射处理,以及所述的映射处理可以为线性映射处理或非线性映射处理。结合第一方面或者第一方面的任意一种实施方式,在第一方面的一种实施方式中,所述对所述幅度相关性差异参数进行限幅处理,以获得限幅处理后的幅度相关性差异参数包括:通过如下计算式对所述幅度相关性差异参数进行限幅处理:其中,diff_lt_corr_limit为所述限幅处理后的幅度相关性差异参数,diff_lt_corr为所述幅度相关性差异参数,RATIO_MAX为所述限幅处理后的幅度相关性差异参数的最大值,RATIO_MIN为所述限幅处理后的幅度相关性差异参数的最小值,且RATIO_MAX>RATIO_MIN,其中RATIO_MAX的取值范围是[1.0,3.0],可以取值为1.0,1.5,或3.0等,RATIO_MIN的取值范围是[-3.0,-1.0],可以取值为-1.0,-1.5,或-3.0等。结合第一方面或者第一方面的任意一种实施方式,在第一方面的一种实施方式中,所述对所述幅度相关性差异参数进行限幅处理,以获得限幅处理后的幅度相关性差异参数包括:通过如下计算式对所述幅度相关性差异参数进行限幅处理:其中,diff_lt_corr_limit为所述限幅处理后的幅度相关性差异参数,diff_lt_corr为所述幅度相关性差异参数,RATIO_MAX为所述限幅处理后的幅度相关性差异参数的最大值,RATIO_MAX的取值范围是[1.0,3.0],可以取值为1.0,1.5,或3.0等。结合第一方面或者第一方面的任意一种实施方式,在第一方面的一种实施方式中,所述对所述限幅处理后的幅度相关性差异参数进行映射处理,从而获得所述映射后的幅度相关性差异参数包括:通过如下计算式对所述幅度相关性差异参数进行映射处理:其中,B1=MAP_MAX-RATIO_MAX*A1或者B1=MAP_HIGH-RATIO_HIGH*A1;B2=MAP_LOW-RATIO_LOW*A2或者B本文档来自技高网...

【技术保护点】
1.一种立体声编码方法,其特征在于,包括:对立体声音频信号的当前帧的左声道时域信号和右声道时域信号进行时域预处理,以获得所述当前帧的预处理后的左声道时域信号和预处理后的右声道时域信号;对所述当前帧的预处理后的左声道时域信号和预处理后的右声道时域信号进行时延对齐处理,以获得所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号;根据所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号确定所述当前帧的声道组合方案;根据确定的所述当前帧的声道组合方案,所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号,获得所述当前帧的量化后的声道组合比例因子和所述量化后的声道组合比例因子的编码索引;根据确定的所述当前帧的声道组合方案,确定所述当前帧的编码模式;根据所述当前帧的编码模式和所述当前帧的量化后的声道组合比例因子,对所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号进行下混处理,以获得所述当前帧的主要声道信号和次要声道信号;对所述当前帧的主要声道信号和次要声道信号进行编码。

【技术特征摘要】
1.一种立体声编码方法,其特征在于,包括:对立体声音频信号的当前帧的左声道时域信号和右声道时域信号进行时域预处理,以获得所述当前帧的预处理后的左声道时域信号和预处理后的右声道时域信号;对所述当前帧的预处理后的左声道时域信号和预处理后的右声道时域信号进行时延对齐处理,以获得所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号;根据所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号确定所述当前帧的声道组合方案;根据确定的所述当前帧的声道组合方案,所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号,获得所述当前帧的量化后的声道组合比例因子和所述量化后的声道组合比例因子的编码索引;根据确定的所述当前帧的声道组合方案,确定所述当前帧的编码模式;根据所述当前帧的编码模式和所述当前帧的量化后的声道组合比例因子,对所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号进行下混处理,以获得所述当前帧的主要声道信号和次要声道信号;对所述当前帧的主要声道信号和次要声道信号进行编码。2.根据权利要求1所述的方法,其特征在于,根据所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号确定所述当前帧的声道组合方案包括:根据所述当前帧时延对齐后的左声道时域信号和时延对齐后的右声道时域信号确定所述当前帧的信号类型,所述信号类型包括类正相信号或类反相信号;至少根据所述当前帧的信号类型对应确定所述当前帧的声道组合方案,所述声道组合方案包括用于处理类反相信号的类反相信号声道组合方案或用于处理类正相信号的类正相信号声道组合方案。3.根据权利要求1或2所述的方法,如果所述当前帧的声道组合方案为用于处理类反相信号的类反相信号声道组合方案;所述根据确定的所述当前帧的声道组合方案,所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号,获得所述当前帧的量化后的声道组合比例因子和所述量化后的声道组合比例因子的编码索引包括:根据所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号,获得所述当前帧的长时平滑后的左声道时域信号与所述当前帧的长时平滑后的右声道时域信号之间的幅度相关性差异参数;将所述幅度相关性差异参数转换为所述当前帧的声道组合比例因子;对所述当前帧的声道组合比例因子进行量化,以获得所述当前帧的量化后的声道组合比例因子以及所述量化后的声道组合比例因子的编码索引。4.根据权利要求3所述的方法,其特征在于,所述将所述幅度相关性差异参数转换为所述当前帧的声道组合比例因子包括:对所述幅度相关性差异参数进行映射处理,以获得映射后的幅度相关性差异参数,所述映射后的幅度相关性差异参数的取值处于预设的幅度相关性差异参数取值范围;将所述映射后的幅度相关性差异参数转换为所述当前帧的声道组合比例因子。5.根据权利要求4所述的方法,其特征在于,所述对所述幅度相关性差异参数进行映射处理包括:对所述幅度相关性差异参数进行限幅处理,以获得限幅处理后的幅度相关性差异参数;对所述限幅处理后的幅度相关性差异参数进行映射处理,从而获得所述映射后的幅度相关性差异参数。6.根据权利要求5所述的方法,其特征在于,所述对所述幅度相关性差异参数进行限幅处理,以获得限幅处理后的幅度相关性差异参数包括:通过如下计算式对所述幅度相关性差异参数进行限幅处理:其中,diff_lt_corr_limit为所述限幅处理后的幅度相关性差异参数,diff_lt_corr为所述幅度相关性差异参数,RATIO_MAX为所述限幅处理后的幅度相关性差异参数的最大值,RATIO_MIN为所述限幅处理后的幅度相关性差异参数的最小值,且RATIO_MAX>RATIO_MIN,其中RATIO_MAX的取值范围是[1.0,3.0],RATIO_MIN的取值范围是[-3.0,-1.0]。7.根据权利要求5所述的方法,其特征在于,所述对所述幅度相关性差异参数进行限幅处理,以获得限幅处理后的幅度相关性差异参数包括:通过如下计算式对所述幅度相关性差异参数进行限幅处理:其中,diff_lt_corr_limit为所述限幅处理后的幅度相关性差异参数,diff_lt_corr为所述幅度相关性差异参数,RATIO_MAX为所述限幅处理后的幅度相关性差异参数的最大值,RATIO_MAX的取值范围是[1.0,3.0]。8.根据权利要求5至7任一所述的方法,其特征在于,所述对所述限幅处理后的幅度相关性差异参数进行映射处理,从而获得所述映射后的幅度相关性差异参数包括:通过如下计算式对所述幅度相关性差异参数进行映射处理:其中,B1=MAP_MAX-RATIO_MAX*A1或者B1=MAP_HIGH-RATIO_HIGH*A1;B2=MAP_LOW-RATIO_LOW*A2或者B2=MAP_MIN-RATIO_MIN*A2;B3=MAP_HIGH-RATIO_HIGH*A3或者B3=MAP_LOW-RATIO_LOW*A3;其中,diff_lt_corr_limit为所述限幅处理后的幅度相关性差异参数,diff_lt_corr_map为所述映射后的幅度相关性差异参数,MAP_MAX为所述映射后的幅度相关性差异参数的取值的最大值,MAP_HIGH为所述映射后的幅度相关性差异参数的取值的高门限,MAP_LOW为所述映射后的幅度相关性差异参数的取值的低门限,MAP_MIN为所述映射后的幅度相关性差异参数的取值的最小值,且MAP_MAX>MAP_HIGH>MAP_LOW>MAP_MIN,其中MAP_MAX的取值范围为[2.0,2.5],MAP_HIGH的取值范围为[1.2,1.7],MAP_LOW的取值范围为[0.8,1.3],MAP_MIN的取值范围为[0.0,0.5];RATIO_MAX为所述限幅处理后的幅度相关性差异参数的最大值,RATIO_HIGH为所述限幅处理后的幅度相关性差异参数的高门限,RATIO_LOW为所述限幅处理后的幅度相关性差异参数的低门限,RATIO_MIN为所述限幅处理后的幅度相关性差异参数的最小值,且RATIO_MAX>RATIO_HIGH>RATIO_LOW>RATIO_MIN,其中RATIO_MAX的取值范围是[1.0,3.0],RATIO_HIGH的取值范围是[0.5,1.0],RATIO_LOW的取值范围是[-1.0,-0.5],RATIO_MIN的取值范围是[-3.0,-1.0]。9.根据权利要求5至7任一所述的方法,其特征在于,所述对所述限幅处理后的幅度相关性差异参数进行映射处理,从而获得所述映射后的幅度相关性差异参数包括:通过如下计算式对所述幅度相关性差异参数进行映射处理:其中,diff_lt_corr_map为所述映射后的幅度相关性差异参数,diff_lt_corr_limit为所述限幅处理后的幅度相关性差异参数,RATIO_MAX为所述限幅处理后的幅度相关性差异参数的最大值,RATIO_MAX的取值范围是[1.0,3.0]。10.根据权利要求5至7任一所述的方法,其特征在于,所述对所述限幅处理后的幅度相关性差异参数进行映射处理,从而获得所述映射后的幅度相关性差异参数包括:通过如下计算式对所述幅度相关性差异参数进行映射处理:diff_lt_corr_map=a*bdiff_lt_corr_limit+c其中,diff_lt_corr_map为所述映射后的幅度相关性差异参数,diff_lt_corr_limit为所述限幅处理后的幅度相关性差异参数,a的取值范围为[0,1],b的取值范围为[1.5,3],c的取值范围为[0,0.5]。11.根据权利要求5至7任一所述的方法,其特征在于,所述对所述限幅处理后的幅度相关性差异参数进行映射处理,从而获得所述映射后的幅度相关性差异参数包括:通过如下计算式对所述幅度相关性差异参数进行映射处理:diff_lt_corr_map=a*(diff_lt_corr_limit+1.5)2+b*(diff_lt_corr_limit+1.5)+c其中,diff_lt_corr_map为所述映射后的幅度相关性差异参数,diff_lt_corr_limit为所述限幅处理后的幅度相关性差异参数,a的取值范围为[0.08,0.12],b的取值范围为[0.03,0.07],c的取值范围为[0.1,0.3]。12.根据权利要求5至11任一所述的方法,其特征在于,所述将所述映射后的幅度相关性差异参数转换为所述当前帧的声道组合比例因子包括:通过如下计算式将所述映射后的幅度相关性差异参数转换为所述当前帧的声道组合比例因子:其中,ratio_SM为所述当前帧的声道组合比例因子,diff_lt_corr_map为所述映射后的幅度相关性差异参数。13.根据权利要求3至12任一所述的方法,其特征在于,所述根据所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号,获得所述当前帧的长时平滑后的左声道时域信号与长时平滑后的右声道时域信号之间的幅度相关性差异参数包括:根据所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号,确定所述当前帧的参考声道信号;计算所述当前帧的时延对齐后的左声道时域信号与所述参考声道信号之间的左声道幅度相关性参数,以及所述当前帧的时延对齐后的右声道时域信号与所述参考声道信号之间的右声道幅度相关性参数;根据所述左声道幅度相关性参数以及所述右声道幅度相关性参数,计算所述当前帧的长时平滑后的左声道时域信号与长时平滑后的右声道时域信号之间的幅度相关性差异参数。14.根据权利要求13所述的方法,其特征在于,所述根据所述左声道幅度相关性参数以及所述右声道幅度相关性参数,计算所述当前帧的长时平滑后的左声道时域信号与长时平滑后的右声道时域信号之间的幅度相关性差异参数包括:根据所述左声道幅度相关性参数确定所述当前帧的长时平滑后的左声道时域信号与所述参考声道信号之间的幅度相关性参数;根据所述右声道幅度相关性参数确定所述当前帧的长时平滑后的右声道时域信号与所述参考声道信号之间的幅度相关性参数;根据所述当前帧的长时平滑后的左声道时域信号与所述参考声道信号之间的幅度相关性参数,以及所述当前帧的长时平滑后的右声道时域信号与所述参考声道信号之间的幅度相关性参数,确定所述当前帧的长时平滑后的左声道时域信号与长时平滑后的右声道时域信号之间的幅度相关性差异参数。15.根据权利要求14所述的方法,其特征在于,所述根据所述当前帧的长时平滑后的左声道时域信号与所述参考声道信号之间的幅度相关性参数,以及所述当前帧的长时平滑后的右声道时域信号与所述参考声道信号之间的幅度相关性参数,确定所述当前帧的长时平滑后的左声道时域信号与长时平滑后的右声道时域信号之间的幅度相关性差异参数包括:通过如下计算式确定所述当前帧的长时平滑后的左声道时域信号与长时平滑后的右声道时域信号之间的幅度相关性差异参数:diff_lt_corr=tdm_lt_corr_LM_SMcur-tdm_lt_corr_RM_SMcur;其中,diff_lt_corr是所述当前帧的长时平滑后的左声道时域信号与长时平滑后的右声道时域信号之间的幅度相关性差异参数,tdm_lt_corr_LM_SMcur是所述当前帧的长时平滑后的左声道时域信号与所述参考声道信号之间的幅度相关性参数,tdm_lt_corr_RM_SMcur是所述当前帧的长时平滑后的右声道时域信号与所述参考声道信号之间的幅度相关性参数。16.根据权利要求14或15所述的方法,其特征在于,所述根据所述左声道幅度相关性参数确定所述当前帧的长时平滑后的左声道时域信号与所述参考声道信号之间的幅度相关性参数包括:通过如下计算式确定所述当前帧的长时平滑后的左声道时域信号与参考声道信号之间的幅度相关性参数tdm_lt_corr_LM_SMcur:tdm_lt_corr_LM_SMcur=α*tdm_lt_corr_LM_SMpre+(1-α)corr_LM;其中,tdm_lt_corr_LM_SMpre为所述当前帧的前一帧的长时平滑后的左声道时域信号与参考声道信号之间的幅度相关性参数,α为平滑因子,α的取值范围为[0,1],corr_LM为所述左声道幅度相关性参数;所述根据所述右声道幅度相关性参数确定所述当前帧的长时平滑后的右声道时域信号与所述参考声道信号之间的幅度相关性参数包括:通过如下计算式确定所述当前帧的长时平滑后的右声道时域信号与参考声道信号之间的幅度相关性参数tdm_lt_corr_RM_SMcur:tdm_lt_corr_RM_SMcur=β*tdm_lt_corr_RM_SMpre+(1-β)corr_LM;其中,tdm_lt_corr_RM_SMpre为所述当前帧的前一帧的长时平滑后的左声道时域信号与参考声道信号之间的幅度相关性参数,β为平滑因子,β的取值范围为[0,1],corr_RM为所述左声道幅度相关性参数。17.根据权利要求13至16任一所述的方法,其特征在于,所述计算所述当前帧的时延对齐后的左声道时域信号与所述参考声道信号之间的左声道幅度相关性参数,以及所述当前帧的时延对齐后的右声道时域信号与所述参考声道信号之间的右声道幅度相关性参数包括:通过如下计算式确定所述当前帧的时延对齐后的左声道时域信号与所述参考声道信号之间的左声道幅度相关性参数corr_LM:其中,x′L(n)为所述当前帧的时延对齐后的左声道时域信号,N为所述当前帧的帧长,mono_i(n)为所述参考声道信号;通过如下计算式确定所述当前帧的时延对齐后的右声道时域信号与所述参考声道信号之间的左声道幅度相关性参数corr_RM:其中,x′R(n)为所述当前帧的时延对齐后的右声道时域信号。18.一种立体声编码器,其特征在于,包括处理器和存储器,所述存储器存储了可执行指令,所述可执行指令用于指示所述处理器执行如下步骤:对立体声音频信号的当前帧的左声道时域信号和右声道时域信号进行时域预处理,以获得所述当前帧的预处理后的左声道时域信号和预处理后的右声道时域信号;对所述当前帧的预处理后的左声道时域信号和预处理后的右声道时域信号进行时延对齐处理,以获得所述当前帧的时延对齐后的左声道时域信号和时延对齐后的右声道时域信号;根据所述当前帧的时延对齐后的左声...

【专利技术属性】
技术研发人员:王宾李海婷苗磊
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1