The present invention provides an encoding method and encoder of the multichannel signal, the encoding method includes: multi-channel signal acquisition of the current frame; determine the initial ITD value of the current frame; according to the characteristic information of the multichannel signal, control the number of consecutive frames allows the target, the peak feature information including multichannel signal the relationship between the parameters and the signal-to-noise ratio of the multichannel signal number of at least one of the target, the ITD value of the frame multiplexing frame before the target frame and the ITD value of the ITD; according to the initial value of the current frame, and the number of consecutive frames allows the target, determine the current frame according to the ITD value of the current frame; the value of ITD, encoding a multi-channel signal. The invention can improve the coding quality of the multichannel signal.
【技术实现步骤摘要】
多声道信号的编码方法和编码器
本专利技术涉及音频信号编码领域,并且更为具体地,涉及一种多声道信号的编码方法和编码器。
技术介绍
随着生活质量的提高,人们对高质量音频的需求不断增大。相对于单声道信号,立体声具有各声源的方位感和分布感,能够提高声音的清晰度、可懂度及临场感,因而备受人们青睐。立体声处理技术主要有和差(Mid/Sid,MS)编码、强度立体声(IntensityStereo,IS)编码以及参数立体声(ParametricStereo,PS)编码。MS编码基于声道间相关性将两路信号作和、差变换,各声道能量主要集中在和声道,使声道间冗余得以去除。在MS编码技术中,码率的节省依赖于输入信号的相关性,当左右声道信号的相关性差时,需分别传输左声道信号和右声道信号。IS编码基于人耳听觉系统对声道的高频成分(例如,大于2kHz的成分)的相位差异不敏感的特性,将左右两路信号的高频分量进行简化处理。但IS编码技术仅对高频成分有效,如将IS编码技术扩展到低频,将会引起严重的人为噪声。PS编码是基于双耳听觉模型的编码方式。如图1所示(图1中的xL为左声道时域信号,xR为右声道时域信号),在PS编码过程中,编码端会将立体声信号转换成单声道信号和少量描述空间声场的空间参数(或称空间感知参数)。如图2所示,解码端得到单声道信号和空间参数之后,会结合空间参数恢复立体声信号。相对于MS编码,PS编码压缩比高,因此,PS编码可以在保持较好音质的前提下,获得更高的编码增益。此外,PS编码可以工作在全音频带宽中,能够很好地还原立体声的空间感知效果。PS编码中,空间参数包括声道间相关性( ...
【技术保护点】
一种多声道信号的编码方法,其特征在于,包括:获取当前帧的多声道信号;确定所述当前帧的初始声道间时间差ITD值;根据所述多声道信号的特征信息,控制允许连续出现的目标帧的数量,所述特征信息包括所述多声道信号的信噪比参数以及所述多声道信号的互相关系数的峰值特性中的至少一个,所述目标帧的ITD值复用了所述目标帧的前一帧的ITD值;根据所述当前帧的初始ITD值,以及所述允许连续出现的目标帧的数量,确定所述当前帧的ITD值;根据所述当前帧的ITD值,对所述多声道信号进行编码。
【技术特征摘要】
1.一种多声道信号的编码方法,其特征在于,包括:获取当前帧的多声道信号;确定所述当前帧的初始声道间时间差ITD值;根据所述多声道信号的特征信息,控制允许连续出现的目标帧的数量,所述特征信息包括所述多声道信号的信噪比参数以及所述多声道信号的互相关系数的峰值特性中的至少一个,所述目标帧的ITD值复用了所述目标帧的前一帧的ITD值;根据所述当前帧的初始ITD值,以及所述允许连续出现的目标帧的数量,确定所述当前帧的ITD值;根据所述当前帧的ITD值,对所述多声道信号进行编码。2.如权利要求1所述的方法,其特征在于,在所述根据所述多声道信号的特征信息,控制允许连续出现的目标帧的数量之前,所述方法还包括:根据所述多声道信号的互相关系数的峰值的幅度和所述多声道信号的互相关系数的峰值位置的索引,确定所述多声道信号的互相关系数的峰值特性。3.如权利要求2所述的方法,其特征在于,所述根据所述多声道信号的互相关系数的峰值的幅度和所述多声道信号的互相关系数的峰值位置的索引,确定所述多声道信号的互相关系数的峰值特性,包括:根据所述多声道信号的互相关系数的峰值的幅度,确定峰值幅度可信度参数,所述峰值幅度可信度参数表征所述多声道信号的互相关系数的峰值幅度的可信度;根据所述多声道信号的互相关系数的峰值位置的索引对应的ITD值,以及所述当前帧的前一帧的ITD值,确定峰值位置波动性参数,所述峰值位置波动性参数表征所述多声道信号的互相关系数的峰值位置的索引对应的ITD值与所述当前帧的前一帧的ITD值的差异;根据所述峰值幅度可信度参数和所述峰值位置波动性参数,确定所述多声道信号的互相关系数的峰值特性。4.如权利要求3所述的方法,其特征在于,所述根据所述多声道信号的互相关系数的峰值的幅度,确定峰值幅度可信度参数,包括:将所述多声道信号的互相关系数中的峰值的幅度值和次大值的幅度值之差与所述峰值的幅度值的比值确定为所述峰值幅度可信度参数。5.如权利要求3或4所述的方法,其特征在于,所述根据所述多声道信号的互相关系数的峰值位置的索引对应的ITD值,以及所述当前帧的前一帧的ITD值,确定峰值位置波动性参数,包括:将所述多声道信号的互相关系数的峰值位置的索引对应的ITD值与所述当前帧的前一帧的ITD值之差的绝对值确定为所述峰值位置波动性参数。6.如权利要求1-5中任一项所述的方法,其特征在于,所述根据所述多声道信号的特征信息,控制允许连续出现的目标帧的数量,包括:根据所述多声道信号的互相关系数的峰值特性,控制允许连续出现的目标帧的数量,在所述多声道信号的互相关系数的峰值特性满足预设条件的情况下,通过调整目标帧计数值和所述目标帧计数值的阈值中的至少一个,减少允许连续出现的目标帧的数量,其中,所述目标帧计数值用于表征当前已连续出现的目标帧的数量,所述目标帧计数值的阈值用于指示允许连续出现的目标帧的数量。7.如权利要求6所述的方法,其特征在于,所述通过调整目标帧计数值和所述目标帧计数值的阈值中的至少一个,减少允许连续出现的目标帧的数量,包括:通过增加所述目标帧计数值,减少允许连续出现的目标帧的数量。8.如权利要求6或7所述的方法,其特征在于,所述通过调整目标帧计数值和所述目标帧计数值的阈值中的至少一个,减少允许连续出现的目标帧的数量,包括:通过减小所述目标帧计数值的阈值,减少允许连续出现的目标帧的数量。9.如权利要求6-8中任一项所述的方法,其特征在于,所述根据所述多声道信号的互相关系数的峰值特性,控制允许连续出现的目标帧的数量,包括:在所述多声道信号的信噪比参数不满足预设的信噪比条件的情况下,才根据所述多声道信号的互相关系数的峰值特性,控制允许连续出现的目标帧的数量;所述方法还包括:在所述多声道信号的信噪比满足所述信噪比条件的情况下,停止复用所述当前帧的前一帧的ITD值作为所述当前帧的ITD值。10.如权利要求1-5中任一项所述的方法,其特征在于,所述根据所述多声道信号的特征信息,控制允许连续出现的目标帧的数量,包括:确定所述多声道信号的信噪比参数是否满足预设的信噪比条件;在所述多声道信号的信噪比参数不满足所述信噪比条件的情况下,根据所述多声道信号的互相关系数的峰值特性,控制允许连续出现的目标帧的数量;在所述多声道信号的信噪比满足所述信噪比条件的情况下,停止复用所述当前帧的前一帧的ITD值作为所述当前帧的ITD值。11.如权利要求9或10所述的方法,其特征在于,所述停止复用所述当前帧的前一帧的ITD值作为所述当前帧的ITD值,包括:增加目标帧计数值,使得所述目标帧计数值的取值大于或等于所述目标帧计数值的阈值,其中,所述目标帧计数值用于表征当前已经连续出现的目标帧的数量,所述目标帧计数值的阈值用于指示允许连续出现的目标帧的数量。12.如权利要求1-11中任一项所述的方法,其特征在于,所述根据所述当前帧的初始ITD值,以及所述允许连续出现的目标帧的数量,确定所述当前帧的ITD值,包括:根...
【专利技术属性】
技术研发人员:李海婷,刘泽新,张兴涛,苗磊,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。