多声道信号的编码方法和编码器技术

技术编号:17364864 阅读:90 留言:0更新日期:2018-02-28 15:48
本发明专利技术提供一种多声道信号的编码方法和编码器,该编码方法包括:获取当前帧的多声道信号;确定当前帧的初始ITD值;根据多声道信号的特征信息,控制允许连续出现的目标帧的数量,特征信息包括多声道信号的信噪比参数以及多声道信号的互相关系数的峰值特性中的至少一个,目标帧的ITD值复用了目标帧的前一帧的ITD值;根据当前帧的初始ITD值,以及允许连续出现的目标帧的数量,确定当前帧的ITD值;根据当前帧的ITD值,对多声道信号进行编码。本发明专利技术能够提高多声道信号的编码质量。

The coding method and encoder of multichannel signal

The present invention provides an encoding method and encoder of the multichannel signal, the encoding method includes: multi-channel signal acquisition of the current frame; determine the initial ITD value of the current frame; according to the characteristic information of the multichannel signal, control the number of consecutive frames allows the target, the peak feature information including multichannel signal the relationship between the parameters and the signal-to-noise ratio of the multichannel signal number of at least one of the target, the ITD value of the frame multiplexing frame before the target frame and the ITD value of the ITD; according to the initial value of the current frame, and the number of consecutive frames allows the target, determine the current frame according to the ITD value of the current frame; the value of ITD, encoding a multi-channel signal. The invention can improve the coding quality of the multichannel signal.

【技术实现步骤摘要】
多声道信号的编码方法和编码器
本专利技术涉及音频信号编码领域,并且更为具体地,涉及一种多声道信号的编码方法和编码器。
技术介绍
随着生活质量的提高,人们对高质量音频的需求不断增大。相对于单声道信号,立体声具有各声源的方位感和分布感,能够提高声音的清晰度、可懂度及临场感,因而备受人们青睐。立体声处理技术主要有和差(Mid/Sid,MS)编码、强度立体声(IntensityStereo,IS)编码以及参数立体声(ParametricStereo,PS)编码。MS编码基于声道间相关性将两路信号作和、差变换,各声道能量主要集中在和声道,使声道间冗余得以去除。在MS编码技术中,码率的节省依赖于输入信号的相关性,当左右声道信号的相关性差时,需分别传输左声道信号和右声道信号。IS编码基于人耳听觉系统对声道的高频成分(例如,大于2kHz的成分)的相位差异不敏感的特性,将左右两路信号的高频分量进行简化处理。但IS编码技术仅对高频成分有效,如将IS编码技术扩展到低频,将会引起严重的人为噪声。PS编码是基于双耳听觉模型的编码方式。如图1所示(图1中的xL为左声道时域信号,xR为右声道时域信号),在PS编码过程中,编码端会将立体声信号转换成单声道信号和少量描述空间声场的空间参数(或称空间感知参数)。如图2所示,解码端得到单声道信号和空间参数之后,会结合空间参数恢复立体声信号。相对于MS编码,PS编码压缩比高,因此,PS编码可以在保持较好音质的前提下,获得更高的编码增益。此外,PS编码可以工作在全音频带宽中,能够很好地还原立体声的空间感知效果。PS编码中,空间参数包括声道间相关性(Inter-channelCoherent,IC)、声道间电平差(Inter-channelLevelDifference,ILD)、声道间时间差(Inter-channelTimeDifference,ITD)以及声道间相位差(Inter-channelPhaseDifference,IPD)。IC描述了声道间的互相关或相干性,该参数决定了声场范围的感知,可以提高音频信号的空间感和声响稳定性。ILD用于分辨立体声源的水平方向角度,描述了声道间的能量差别,该参数将影响整个频谱的频率成分。ITD和IPD为表示声源水平方位的空间参数,描述了声道间的时间和相位的差别。ILD、ITD和IPD能够决定人耳对声源位置的感知,可以有效确定声场位置,对立体声信号的恢复具有重要作用。在立体声的录音过程中,受到背景噪声、混响、多人同时讲话等因素的影响,按照现有的PS编码方式计算出的ITD经常会出现不稳定(ITD的取值来回跳变)的现象。如果基于这样的ITD计算下混合信号,就会导致下混合信号不连续,从而导致解码端得到的立体声质量差,如解码端播放的立体声的声像会频繁晃动,甚至出现听感上的卡顿。
技术实现思路
本申请提供一种多声道信号的编码方法和编码器,以提升PS编码中的ITD的稳定性,从而提升多声道信号的编码质量。第一方面,提供一种多声道信号的编码方法,包括:获取当前帧的多声道信号;确定所述当前帧的初始ITD值;根据所述多声道信号的特征信息,控制允许连续出现的目标帧的数量,所述特征信息包括所述多声道信号的信噪比参数以及所述多声道信号的互相关系数的峰值特性中的至少一个,所述目标帧的ITD值复用了所述目标帧的前一帧的ITD值;根据所述当前帧的初始ITD值,以及所述允许连续出现的目标帧的数量,确定所述当前帧的ITD值;根据所述当前帧的ITD值,对所述多声道信号进行编码。结合第一方面,在第一方面的某些实现方式中,在所述根据所述多声道信号的特征信息,控制允许连续出现的目标帧的数量之前,所述方法还包括:根据所述多声道信号的互相关系数的峰值的幅度和所述多声道信号的互相关系数的峰值位置的索引,确定所述多声道信号的互相关系数的峰值特性。结合第一方面,在第一方面的某些实现方式中,所述根据所述多声道信号的互相关系数的峰值的幅度和所述多声道信号的互相关系数的峰值位置的索引,确定所述多声道信号的互相关系数的峰值特性,包括:根据所述多声道信号的互相关系数的峰值的幅度,确定峰值幅度可信度参数,所述峰值幅度可信度参数表征所述多声道信号的互相关系数的峰值幅度的可信度;根据所述多声道信号的互相关系数的峰值位置的索引对应的ITD值,以及所述当前帧的前一帧的ITD值,确定峰值位置波动性参数,所述峰值位置波动性参数表征所述多声道信号的互相关系数的峰值位置的索引对应的ITD值与所述当前帧的前一帧的ITD值的差异;根据所述峰值幅度可信度参数和所述峰值位置波动性参数,确定所述多声道信号的互相关系数的峰值特性。结合第一方面,在第一方面的某些实现方式中,所述根据所述多声道信号的互相关系数的峰值的幅度,确定峰值幅度可信度参数,包括:将所述多声道信号的互相关系数中的峰值的幅度值和次大值的幅度值之差与所述峰值的幅度值的比值确定为所述峰值幅度可信度参数。结合第一方面,在第一方面的某些实现方式中,所述根据所述多声道信号的互相关系数的峰值位置的索引对应的ITD值,以及所述当前帧的前一帧的ITD值,确定峰值位置波动性参数,包括:将所述多声道信号的互相关系数的峰值位置的索引对应的ITD值与所述当前帧的前一帧的ITD值之差的绝对值确定为所述峰值位置波动性参数。结合第一方面,在第一方面的某些实现方式中,所述根据所述多声道信号的特征信息,控制允许连续出现的目标帧的数量,包括:根据所述多声道信号的互相关系数的峰值特性,控制允许连续出现的目标帧的数量,在所述多声道信号的互相关系数的峰值特性满足预设条件的情况下,通过调整目标帧计数值和所述目标帧计数值的阈值中的至少一个,减少允许连续出现的目标帧的数量,其中,所述目标帧计数值用于表征当前已连续出现的目标帧的数量,所述目标帧计数值的阈值用于指示允许连续出现的目标帧的数量。结合第一方面,在第一方面的某些实现方式中,所述通过调整目标帧计数值和所述目标帧计数值的阈值中的至少一个,减少允许连续出现的目标帧的数量,包括:通过增加所述目标帧计数值,减少允许连续出现的目标帧的数量。结合第一方面,在第一方面的某些实现方式中,所述通过调整目标帧计数值和所述目标帧计数值的阈值中的至少一个,减少允许连续出现的目标帧的数量,包括:通过减小所述目标帧计数值的阈值,减少允许连续出现的目标帧的数量。结合第一方面,在第一方面的某些实现方式中,所述根据所述多声道信号的互相关系数的峰值特性,控制允许连续出现的目标帧的数量,包括:在所述多声道信号的信噪比参数不满足预设的信噪比条件的情况下,才根据所述多声道信号的互相关系数的峰值特性,控制允许连续出现的目标帧的数量;所述方法还包括:在所述多声道信号的信噪比满足所述信噪比条件的情况下,停止复用所述当前帧的前一帧的ITD值作为所述当前帧的ITD值。结合第一方面,在第一方面的某些实现方式中,所述根据所述多声道信号的特征信息,控制允许连续出现的目标帧的数量,包括:确定所述多声道信号的信噪比参数是否满足预设的信噪比条件;在所述多声道信号的信噪比参数不满足所述信噪比条件的情况下,根据所述多声道信号的互相关系数的峰值特性,控制允许连续出现的目标帧的数量;在所述多声道信号的信噪比满足所述信噪比条件的情况下,停本文档来自技高网
...
多声道信号的编码方法和编码器

【技术保护点】
一种多声道信号的编码方法,其特征在于,包括:获取当前帧的多声道信号;确定所述当前帧的初始声道间时间差ITD值;根据所述多声道信号的特征信息,控制允许连续出现的目标帧的数量,所述特征信息包括所述多声道信号的信噪比参数以及所述多声道信号的互相关系数的峰值特性中的至少一个,所述目标帧的ITD值复用了所述目标帧的前一帧的ITD值;根据所述当前帧的初始ITD值,以及所述允许连续出现的目标帧的数量,确定所述当前帧的ITD值;根据所述当前帧的ITD值,对所述多声道信号进行编码。

【技术特征摘要】
1.一种多声道信号的编码方法,其特征在于,包括:获取当前帧的多声道信号;确定所述当前帧的初始声道间时间差ITD值;根据所述多声道信号的特征信息,控制允许连续出现的目标帧的数量,所述特征信息包括所述多声道信号的信噪比参数以及所述多声道信号的互相关系数的峰值特性中的至少一个,所述目标帧的ITD值复用了所述目标帧的前一帧的ITD值;根据所述当前帧的初始ITD值,以及所述允许连续出现的目标帧的数量,确定所述当前帧的ITD值;根据所述当前帧的ITD值,对所述多声道信号进行编码。2.如权利要求1所述的方法,其特征在于,在所述根据所述多声道信号的特征信息,控制允许连续出现的目标帧的数量之前,所述方法还包括:根据所述多声道信号的互相关系数的峰值的幅度和所述多声道信号的互相关系数的峰值位置的索引,确定所述多声道信号的互相关系数的峰值特性。3.如权利要求2所述的方法,其特征在于,所述根据所述多声道信号的互相关系数的峰值的幅度和所述多声道信号的互相关系数的峰值位置的索引,确定所述多声道信号的互相关系数的峰值特性,包括:根据所述多声道信号的互相关系数的峰值的幅度,确定峰值幅度可信度参数,所述峰值幅度可信度参数表征所述多声道信号的互相关系数的峰值幅度的可信度;根据所述多声道信号的互相关系数的峰值位置的索引对应的ITD值,以及所述当前帧的前一帧的ITD值,确定峰值位置波动性参数,所述峰值位置波动性参数表征所述多声道信号的互相关系数的峰值位置的索引对应的ITD值与所述当前帧的前一帧的ITD值的差异;根据所述峰值幅度可信度参数和所述峰值位置波动性参数,确定所述多声道信号的互相关系数的峰值特性。4.如权利要求3所述的方法,其特征在于,所述根据所述多声道信号的互相关系数的峰值的幅度,确定峰值幅度可信度参数,包括:将所述多声道信号的互相关系数中的峰值的幅度值和次大值的幅度值之差与所述峰值的幅度值的比值确定为所述峰值幅度可信度参数。5.如权利要求3或4所述的方法,其特征在于,所述根据所述多声道信号的互相关系数的峰值位置的索引对应的ITD值,以及所述当前帧的前一帧的ITD值,确定峰值位置波动性参数,包括:将所述多声道信号的互相关系数的峰值位置的索引对应的ITD值与所述当前帧的前一帧的ITD值之差的绝对值确定为所述峰值位置波动性参数。6.如权利要求1-5中任一项所述的方法,其特征在于,所述根据所述多声道信号的特征信息,控制允许连续出现的目标帧的数量,包括:根据所述多声道信号的互相关系数的峰值特性,控制允许连续出现的目标帧的数量,在所述多声道信号的互相关系数的峰值特性满足预设条件的情况下,通过调整目标帧计数值和所述目标帧计数值的阈值中的至少一个,减少允许连续出现的目标帧的数量,其中,所述目标帧计数值用于表征当前已连续出现的目标帧的数量,所述目标帧计数值的阈值用于指示允许连续出现的目标帧的数量。7.如权利要求6所述的方法,其特征在于,所述通过调整目标帧计数值和所述目标帧计数值的阈值中的至少一个,减少允许连续出现的目标帧的数量,包括:通过增加所述目标帧计数值,减少允许连续出现的目标帧的数量。8.如权利要求6或7所述的方法,其特征在于,所述通过调整目标帧计数值和所述目标帧计数值的阈值中的至少一个,减少允许连续出现的目标帧的数量,包括:通过减小所述目标帧计数值的阈值,减少允许连续出现的目标帧的数量。9.如权利要求6-8中任一项所述的方法,其特征在于,所述根据所述多声道信号的互相关系数的峰值特性,控制允许连续出现的目标帧的数量,包括:在所述多声道信号的信噪比参数不满足预设的信噪比条件的情况下,才根据所述多声道信号的互相关系数的峰值特性,控制允许连续出现的目标帧的数量;所述方法还包括:在所述多声道信号的信噪比满足所述信噪比条件的情况下,停止复用所述当前帧的前一帧的ITD值作为所述当前帧的ITD值。10.如权利要求1-5中任一项所述的方法,其特征在于,所述根据所述多声道信号的特征信息,控制允许连续出现的目标帧的数量,包括:确定所述多声道信号的信噪比参数是否满足预设的信噪比条件;在所述多声道信号的信噪比参数不满足所述信噪比条件的情况下,根据所述多声道信号的互相关系数的峰值特性,控制允许连续出现的目标帧的数量;在所述多声道信号的信噪比满足所述信噪比条件的情况下,停止复用所述当前帧的前一帧的ITD值作为所述当前帧的ITD值。11.如权利要求9或10所述的方法,其特征在于,所述停止复用所述当前帧的前一帧的ITD值作为所述当前帧的ITD值,包括:增加目标帧计数值,使得所述目标帧计数值的取值大于或等于所述目标帧计数值的阈值,其中,所述目标帧计数值用于表征当前已经连续出现的目标帧的数量,所述目标帧计数值的阈值用于指示允许连续出现的目标帧的数量。12.如权利要求1-11中任一项所述的方法,其特征在于,所述根据所述当前帧的初始ITD值,以及所述允许连续出现的目标帧的数量,确定所述当前帧的ITD值,包括:根...

【专利技术属性】
技术研发人员:李海婷刘泽新张兴涛苗磊
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1