一种立体声信号处理方法及装置制造方法及图纸

技术编号:24105745 阅读:47 留言:0更新日期:2020-05-09 16:57
一种立体声信号处理方法及装置,其中方法包括:对当前帧的立体声信号进行时延估计,确定所述当前帧的声道间时间差;所述当前帧的声道间时间差为所述当前帧的第一声道信号与所述当前帧的第二声道信号之间的时间差;若所述当前帧的声道间时间差的符号与所述当前帧的前一帧的声道间时间差的符号不同,则根据所述当前帧的声道间时间差对所述当前帧的第一声道信号进行时延对齐处理、根据所述前一帧的声道间时间差对所述当前帧的第二声道信号进行时延对齐处理;所述第一声道信号为所述当前帧的目标声道信号,所述第二声道信号与所述前一帧的目标声道信号处于相同声道。

A stereo signal processing method and device

【技术实现步骤摘要】
【国外来华专利技术】一种立体声信号处理方法及装置本申请要求在2017年5月16日提交国家专利局、申请号为201710344704.4、专利技术名称为“一种立体声信号处理方法及装置”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
本申请涉及信息
,尤其涉及一种立体声信号处理方法及装置。
技术介绍
随着生活质量的提高,人们对高质量音频的需求不断增大。相对于单声道音频,立体声音频具有各声源的方位感和分布感,能够提高信息的清晰度、可懂度及临场感,因而备受人们青睐。现有的时域立体声编码技术,通常是在时域将左声道信号和右声道信号下混为中央通道(Mid channel)信号以及边通道(Side channel)信号。下混后的中央通道信号可以表示为0.5×(L+R),表征了左声道信号和右声道信号之间的相关信息;下混后的边通道信号可以表示为0.5×(L-R),表征了左声道信号和右声道信号之间的差异信息,其中L表示左声道信号,R表示右声道信号。然后,再分别对中央通道信号及边通道信号采用单声道编码方法进行编码。对于中央通道信号,通常用较多的比特数进行编码;对于边通道信号,通常用较少的比特数进行编码。为了提高编码效率,需要使得中央通道信号更大,而边通道信号更小。目前在时域立体声编码中,在获得中央通道信号及边通道信号之前会使用匹配算法对左声道信号和右声道信号进行时延估计得到声道间时间差,并根据声道间时间差对左声道信号和右声道信号进行时延对齐处理,从而使得下混后获得的中央通道信号更大、而边通道信号更小。根据声道间时间差进行时延对齐的算法中,通常的做法是从左声道和右两个声道中选择一个声道,对该声道的信号进行时延对齐处理,这个声道被称为目标声道;而另一个声道的信号不进行时延调整,只是作为目标声道进行时延调整的一个参考,这个声道被称为参考声道。现有方法中,若发现时延估计得到的当前帧的声道间时间差的符号不同于前一帧的声道间时间差的符号,则将当前帧的目标声道的选择保持和前一帧的目标声道相同。同时无论当前帧的声道间时间差的估计值是多少,都将其强制的设为零。然后,根据设置为零的声道间时间差对当前帧的目标声道进行时延对齐处理,从而保证时延对齐处理后的当前帧的目标声道和参考声道之间的时延为零。上述方法中,当两帧立体声信号的声道间时间差的符号发生变化,说明左右声道的信号到达先后顺序发生了变化,可能是从左声道信号先到达转变成右声道信号先到达,也可能是从右声道信号先到达转变成左声道信号先到达。如果将当前帧的声道间时间差强制设置为零,就只是按照零时间差而非左右声道真实的时间差调整左右声道,对这样获得的时延调整后的左右声道信号进行时域下混处理,但实际上两个声道的信号并没有实现真正的时延对齐,也就没有办法有效的对两个声道之间的相关性成分进行抵消,造成当前帧时域下混后的边通道信号能量变大,降低了立体声编码的整体质量。
技术实现思路
本申请提供一种立体声信号处理方法及装置,用以解决在两帧立体声信号的声道间时间差的符号发生变化时,由于声道间时延不对齐,导致的立体声编码的编码质量低的问题。本申请实施例提供了一种立体声信号处理方法,应用于立体声编解码器的编码端,该方法包括:对当前帧的立体声信号进行时延估计,确定所述当前帧的声道间时间差;所述当前帧的声道间时间差为所述当前帧的第一声道信号与所述当前帧的第二声道信号之间的时间差;若所述当前帧的声道间时间差的符号与所述当前帧的前一帧的声道间时间差的符号不同,则根据所述当前帧的声道间时间差对所述当前帧的第一声道信号进行时延对齐处理、根据所述前一帧的声道间时间差对所述当前帧的第二声道信号进行时延对齐处理;所述第一声道信号为所述当前帧的目标声道信号,所述第二声道信号与所述前一帧的目标声道信号处于相同声道。根据本申请提供的方法,当确定当前帧的声道间时间差的符号与当前帧的前一帧的声道间时间差的符号不同时,根据所述当前帧的声道间时间差对所述当前帧的第一声道信号进行时延对齐处理、根据所述前一帧的声道间时间差对所述当前帧的第二声道信号进行时延对齐处理,使得当前帧的时延对齐处理能够按照真实的声道间时间差进行,保证了对齐效果更优,避免了现有技术中因为将当前帧的声道间时间差强制设置为零,而导致时延对齐处理后当前帧两个声道之间的相关性成分无法进行抵消,造成当前帧时域下混后的次要声道信号能量变大、影响编码整体质量的问题。可选的,根据所述当前帧的声道间时间差对所述当前帧的第一声道信号进行时延对齐处理,包括:将所述当前帧的第一声道信号中第一处理长度的信号压缩为第一对齐处理长度的信号,以获得时延对齐处理后的所述当前帧的第一声道信号;所述第一处理长度是根据所述当前帧的声道间时间差和所述第一对齐处理长度确定的,所述第一处理长度大于所述第一对齐处理长度。可选的,所述第一处理长度为所述当前帧的声道间时间差的绝对值与所述第一对齐处理长度之和。可选的,所述第一处理长度的信号的起始点位于所述第一对齐处理长度的信号的起始点之前、且所述第一处理长度的信号的起始点与第一对齐处理长度的信号的起始点之间的长度为当前帧的声道间时间差的绝对值。可选的,所述第一对齐处理长度的信号的起始点位于当前帧的第一声道信号的起始点或位于当前帧的第一声道信号的起始点之后,且所述第一对齐处理长度的信号的起始点与所述当前帧的第一声道信号结束点之间的长度大于或等于所述第一对齐处理长度。可选的,所述第一对齐处理长度的信号的起始点位于当前帧的第一声道信号的起始点之前,且与当前帧的第一声道信号的起始点之间的长度小于或等于过渡长度,且所述第一对齐处理长度的信号的起始点与所述当前帧的第一声道信号的结束点之间的长度大于或等于所述第一对齐处理长度与所述过渡长度之和,其中,所述过渡长度小于或等于当前帧的声道间时间差的绝对值的最大值。可选的,根据所述前一帧的声道间时间差对所述当前帧的第二声道信号进行时延对齐处理,包括:将所述当前帧的第二声道信号中第二处理长度的信号拉伸为第二对齐处理长度的信号,以获得时延对齐处理后的所述当前帧的第二声道信号;所述第二处理长度是根据所述前一帧的声道间时间差和所述第二对齐处理长度确定的,所述第二处理长度小于所述第二对齐处理长度。可选的,所述第二处理长度为所述第二对齐处理长度与所述前一帧的声道间时间差的绝对值之差。可选的,所述第二处理长度的信号的起始点位于所述第二对齐处理长度的信号的起始点之后、且所述第二处理长度的信号的起始点与第二对齐处理长度的信号的起始点之间的长度为前一帧的声道间时间差的绝对值。可选的,所述第二对齐处理长度的信号的起始点位于当前帧的第二声道信号的起始点或位于当前帧的第二声道信号的起始点之后,且所述第二对齐处理长度的信号的起始点与所述当前帧的第二声道信号的结束点之间的长度大于或等于所述第二对齐处理长度。可选的,所述第二对齐处理长度的信号的起始点与当前帧的第二声道信号的起始点之间的长度等于第二预本文档来自技高网
...

【技术保护点】
一种立体声信号处理方法,其特征在于,所述方法包括:/n对当前帧的立体声信号进行时延估计,确定所述当前帧的声道间时间差;所述当前帧的声道间时间差为所述当前帧的第一声道信号与所述当前帧的第二声道信号之间的时间差;/n若所述当前帧的声道间时间差的符号与所述当前帧的前一帧的声道间时间差的符号不同,则根据所述当前帧的声道间时间差对所述当前帧的第一声道信号进行时延对齐处理、根据所述前一帧的声道间时间差对所述当前帧的第二声道信号进行时延对齐处理;所述第一声道信号为所述当前帧的目标声道信号,所述第二声道信号与所述前一帧的目标声道信号处于相同声道。/n

【技术特征摘要】
【国外来华专利技术】20170516 CN 2017103447044一种立体声信号处理方法,其特征在于,所述方法包括:
对当前帧的立体声信号进行时延估计,确定所述当前帧的声道间时间差;所述当前帧的声道间时间差为所述当前帧的第一声道信号与所述当前帧的第二声道信号之间的时间差;
若所述当前帧的声道间时间差的符号与所述当前帧的前一帧的声道间时间差的符号不同,则根据所述当前帧的声道间时间差对所述当前帧的第一声道信号进行时延对齐处理、根据所述前一帧的声道间时间差对所述当前帧的第二声道信号进行时延对齐处理;所述第一声道信号为所述当前帧的目标声道信号,所述第二声道信号与所述前一帧的目标声道信号处于相同声道。


根据权利要求1所述的方法,其特征在于,根据所述当前帧的声道间时间差对所述当前帧的第一声道信号进行时延对齐处理,包括:
将所述当前帧的第一声道信号中第一处理长度的信号压缩为第一对齐处理长度的信号,以获得时延对齐处理后的所述当前帧的第一声道信号;
所述第一处理长度是根据所述当前帧的声道间时间差和所述第一对齐处理长度确定的,所述第一处理长度大于所述第一对齐处理长度。


根据权利要求2所述的方法,其特征在于,所述第一处理长度为所述当前帧的声道间时间差的绝对值与所述第一对齐处理长度之和。


根据权利要求3所述的方法,其特征在于,所述第一处理长度的信号的起始点位于所述第一对齐处理长度的信号的起始点之前、且所述第一处理长度的信号的起始点与第一对齐处理长度的信号的起始点之间的长度为当前帧的声道间时间差的绝对值。


根据权利要求3所述的方法,其特征在于,所述第一对齐处理长度的信号的起始点位于当前帧的第一声道信号的起始点或位于当前帧的第一声道信号的起始点之后,且所述第一对齐处理长度的信号的起始点与所述当前帧的第一声道信号结束点之间的长度大于或等于所述第一对齐处理长度。


根据权利要求3所述的方法,其特征在于,所述第一对齐处理长度的信号的起始点位于当前帧的第一声道信号的起始点之前,且与当前帧的第一声道信号的起始点之间的长度小于或等于过渡长度,且所述第一对齐处理长度的信号的起始点与所述当前帧的第一声道信号的结束点之间的长度大于或等于所述第一对齐处理长度与所述过渡长度之和,其中,所述过渡长度小于或等于当前帧的声道间时间差的绝对值的最大值。


根据权利要求1至6任一所述的方法,其特征在于,根据所述前一帧的声道间时间差对所述当前帧的第二声道信号进行时延对齐处理,包括:
将所述当前帧的第二声道信号中第二处理长度的信号拉伸为第二对齐处理长度的信号,以获得时延对齐处理后的所述当前帧的第二声道信号;
所述第二处理长度是根据所述前一帧的声道间时间差和所述第二对齐处理长度确定的,所述第二处理长度小于所述第二对齐处理长度。


根据权利要求7所述的方法,其特征在于,所述第二处理长度为所述第二对齐处理长度与所述前一帧的声道间时间差的绝对值之差。


根据权利要求8所述的方法,其特征在于,所述第二处理长度的信号的起始点位

于所述第二对齐处理长度的信号的起始点之后、且所述第二处理长度的信号的起始点与第二对齐处理长度的信号的起始点之间的长度为前一帧的声道间时间差的绝对值。


根据权利要求8所述的方法,其特征在于,所述第二对齐处理长度的信号的起始点位于当前帧的第二声道信号的起始点或位于当前帧的第二声道信号的起始点之后,且所述第二对齐处理长度的信号的起始点与所述当前帧的第二声道信号的结束点之间的长度大于或等于所述第二对齐处理长度。


根据权利要求7至10任一所述的方法,其特征在于,所述第二对齐处理长度的信号的起始点与当前帧的第二声道信号的起始点之间的长度等于第二预设长度;所述第一对齐处理长度的信号的起始点与当前帧的第一声道信号的起始点之间的长度等于第二预设长度与第二对齐处理长度之和。


根据权利要求2至11任一所述的方法,其特征在于,所述第一对齐处理长度小于或等于所述当前帧的帧长,所述第一对齐处理长度为预先设定的长度,或者,所述第一对齐处理长度满足以下公式:



其中,L_next_target为所述第一对齐处理长度,cur_itd为所述当前帧的声道间时间差,prev_itd为所述前一帧的声道间时间差,L为时延对齐处理的处理长度。


根据权利要求7至12任一所述的方法,其特征在于,所述第二对齐处理长度小于或等于所述当前帧的帧长,所述第二对齐处理长度为预先设定的长度,或者,所述第二对齐处理长度满足以下公式:



其中,L_pre_target为所述第二对齐处理长度,cur_itd为所述当前帧的声道间时间差,prev_itd为所述前一帧的声道间时间差,L为时延对齐处理的处理长度。


根据权利要求12或13所述的方法,其特征在于,所述时延对齐处理的处理长度小于或等于所述当前帧的帧长,所述时延对齐处理的处理长度为预先设定的长度;或者,所述时延对齐处理的处理长度满足以下公式:



其中,L为时延对齐处理的处理长度,MAX_DELAY_CHANGE为相邻帧声道间时间差的最大差值,L_init为预设的时延对齐处理的处理长度。


一种立体声信号处理方法,其特征在于,所述方法包括:
根据接收到的码流确定当前帧的声道间时间差;所述当前帧的声道间时间差为所述当前帧的第一声道信号与所述当前帧的第二声道信号之间的时间差;
若所述当前帧的声道间时间差的符号与所述当前帧的前一帧的声道间时间差的符号不同,则根据所述当前帧的声道间时间差对所述当前帧的第一声道信号进行时延恢复处理、根据所述前一帧的声道间时间差对所述当前帧的第二声道信号进行时延恢复处理;所述第一声道信号为所述当前帧的目标声道信号,所述第二声道信号与所述前一帧的目标声

道信号处于相同声道。


根据权利要求15所述的方法,其特征在于,所述根据所述当前帧的声道间时间差对所述当前帧的第一声道信号进行时延恢复处理,包括:
将所述当前帧的第一声道信号中第三处理长度的信号拉伸为第三对齐处理长度的信号,以获得时延恢复处理后的所述当前帧的第一声道信号;
所述第三处理长度是根据所述当前帧的声道间时间差和所述第三对齐处理长度确定的,所述第三处理长度小于所述第三对齐处理长度。


根据权利要求16所述的方法,其特征在于,所述第三处理长度为所述第三对齐处理长度与所述当前帧的声道间时间差的绝对值之差。


根据权利要求17所述的方法,其特征在于,所述第三处理长度的信号的起始点位于所述第三对齐处理长度的信号的起始点之后、且所述第三处理长度的信号的起始点与第三对齐处理长度的信号的起始点之间的长度为当前帧的声道间时间差的绝对值。


根据权利要求18所述的方法,其特征在于,所述第三处理长度的信号的起始点位于所述当前帧的第一声道信号的起始点或位于当前帧的第一声道信号的起始点之后,且所述第三处理长度的信号的起始点与当前帧的第一声道信号的结束点之间的长度大于或等于所述第三对齐处理长度与当前帧的声道间时间差的绝对值之差。


根据权利要求15至16任一所述的方法,其特征在于,所述根据所述前一帧的声道间时间差对所述当前帧的第二声道信号进行时延恢复处理,包括:
将所述当前帧的第二声道信号中第四处理长度的信号压缩为第...

【专利技术属性】
技术研发人员:艾雅·苏谟特李海婷苗磊
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1