多声道信号的编码方法和编码器技术

技术编号:17347939 阅读:78 留言:0更新日期:2018-02-25 14:29
本发明专利技术提供一种多声道信号的编码方法和编码器,该编码方法包括:获取当前帧的多声道信号;确定当前帧的初始多声道参数;根据当前帧的初始多声道参数,以及当前帧的前K帧的多声道参数,确定差异参数,差异参数用于表征当前帧的初始多声道参数与前K帧的多声道参数的差异,其中,K为大于或等于1的整数;根据差异参数和当前帧的特征参数,确定当前帧的多声道参数;根据当前帧的多声道参数对多声道信号进行编码。本发明专利技术能够更好地保证多声道信号的声道间信息的准确性。

The coding method and encoder of multichannel signal

The present invention provides an encoding method and encoder of the multichannel signal, the encoding method includes: multi-channel signal acquisition of the current frame; determine the initial current frame multi-channel parameters; according to the initial current frame multi channel parameters, and K frame of the current frame of the multi track parameters, determine the parameters difference, difference, difference the parameters for multi-channel parameters initial characterization of current frame Multichannel parameters and before the K frame in which K is greater than or equal to 1 integer; according to the characteristic parameters of difference parameters and the current frame, determine the multi-channel parameters of the current frame; according to the multi-channel signal encoding Multichannel parameters when the previous frame. The invention can better ensure the accuracy of the inter channel information of the multichannel signal.

【技术实现步骤摘要】
多声道信号的编码方法和编码器
本专利技术涉及音频信号编码领域,并且更为具体地,涉及一种多声道信号的编码方法和编码器。
技术介绍
随着生活质量的提高,人们对高质量音频的需求不断增大。相对于单声道信号,立体声具有各声源的方位感和分布感,能够提高声音的清晰度、可懂度及临场感,因而备受人们青睐。立体声处理技术主要有和差(Mid/Sid,MS)编码、强度立体声(IntensityStereo,IS)编码以及参数立体声(ParametricStereo,PS)编码。MS编码基于声道间相关性将两路信号作和、差变换,各声道能量主要集中在和声道,使声道间冗余得以去除。在MS编码技术中,码率的节省依赖于输入信号的相关性,当左右声道信号的相关性差时,需分别传输左声道信号和右声道信号。IS编码基于人耳听觉系统对声道的高频成分(例如,大于2kHz的成分)的相位差异不敏感的特性,将左右两路信号的高频分量进行简化处理。但IS编码技术仅对高频成分有效,如将IS编码技术扩展到低频,将会引起严重的人为噪声。PS编码是基于双耳听觉模型的编码方式。如图1所示(图1中的xL为左声道时域信号,xR为右声道时域信号),在PS编码过程中,编码端会将立体声信号转换成单声道信号和少量描述空间声场的空间参数(或称空间感知参数)。如图2所示,解码端得到单声道信号和空间参数之后,会结合空间参数恢复立体声信号。相对于MS编码,PS编码压缩比高,因此,PS编码可以在保持较好音质的前提下,获得更高的编码增益。此外,PS编码可以工作在全音频带宽中,能够很好地还原立体声的空间感知效果。PS编码中,多声道参数(也可称为空间参数)包括声道间相关性(Inter-channelCoherent,IC)、声道间电平差(Inter-channelLevelDifference,ILD)、声道间时间差(Inter-channelTimeDifference,ITD),整体相位差(OverallPhaseDifference,OPD)以及声道间相位差(Inter-channelPhaseDifference,IPD)等。IC描述了声道间的互相关或相干性,该参数决定了声场范围的感知,可以提高音频信号的空间感和声响稳定性。ILD用于分辨立体声源的水平方向角度,描述了声道间的能量差别,该参数将影响整个频谱的频率成分。ITD和IPD为表示声源水平方位的空间参数,描述了声道间的时间和相位的差别。ILD、ITD和IPD能够决定人耳对声源位置的感知,可以有效确定声场位置,对立体声信号的恢复具有重要作用。在立体声的录音过程中,受到背景噪声、混响、多人同时讲话等因素的影响,按照现有的PS编码方式计算出的多声道参数经常会出现不稳定(多声道参数取值来回跳变)的现象。如果基于这样的多声道参数计算下混合信号,就会导致下混合信号不连续,从而导致解码端得到的立体声质量差,如解码端播放的立体声的声像会频繁晃动,甚至出现听感上的卡顿。
技术实现思路
本申请提供一种多声道信号的编码方法和编码器,以提升PS编码中的多声道参数的稳定性,从而提升音频信号的编码质量。第一方面,提供一种多声道信号的编码方法,包括:获取当前帧的多声道信号;确定所述当前帧的初始多声道参数;根据所述当前帧的初始多声道参数,以及所述当前帧的前K帧的多声道参数,确定差异参数,所述差异参数用于表征所述当前帧的初始多声道参数与所述前K帧的多声道参数的差异,其中,K为大于或等于1的整数;根据所述差异参数和所述当前帧的特征参数,确定所述当前帧的多声道参数;根据所述当前帧的多声道参数对所述多声道信号进行编码。当前帧的多声道参数是在综合考虑了当前帧与前K帧之间的差异以及当前帧的特征参数之后确定的,这样的确定方式更加合理,与当前帧直接复用前一帧的多声道参数的方式相比,能够更好地保证多声道信号的声道间信息的准确性。结合第一方面,在第一方面的某些实现方式中,所述根据所述差异参数和所述当前帧的特征参数,确定所述当前帧的多声道参数,包括:在所述差异参数满足第一预设条件的情况下,根据所述当前帧的特征参数,确定所述当前帧的多声道参数。结合第一方面,在第一方面的某些实现方式中,所述差异参数为所述当前帧的初始多声道参数和所述当前帧的前一帧的多声道参数的差值的绝对值,所述第一预设条件为所述差异参数大于预设的第一阈值。结合第一方面,在第一方面的某些实现方式中,所述差异参数为所述当前帧的初始多声道参数和所述当前帧的前一帧的多声道参数的乘积,所述第一预设条件为所述差异参数小于或等于0。结合第一方面,在第一方面的某些实现方式中,所述根据所述当前帧的特征参数,确定所述当前帧的多声道参数,包括:根据所述当前帧的相关性参数,确定所述当前帧的多声道参数,其中,所述相关性参数用于表征所述当前帧与所述当前帧的前一帧的相关程度。结合第一方面,在第一方面的某些实现方式中,所述方法还包括:根据所述当前帧的多声道信号中的目标声道信号,以及所述前一帧的多声道信号中的目标声道信号,确定所述相关性参数。结合第一方面,在第一方面的某些实现方式中,所述根据所述当前帧的多声道信号中的目标声道信号,以及所述前一帧的多声道信号中的目标声道信号,确定所述相关性参数,包括:根据所述当前帧的多声道信号中的目标声道信号的频域参数,以及所述前一帧的多声道信号中的目标声道信号的频域参数,确定所述相关性参数,所述频域参数为所述目标声道信号的频域幅度值和频域系数中的至少一个。结合第一方面,在第一方面的某些实现方式中,所述方法还包括:根据所述当前帧的基音周期,以及所述前一帧的基音周期,确定所述相关性参数。结合第一方面,在第一方面的某些实现方式中,所述根据所述当前帧的特征参数,确定所述当前帧的多声道参数,包括:在所述特征参数满足第二预设条件的情况下,根据所述当前帧的前T帧的多声道参数,确定所述当前帧的多声道参数,T为大于或等于1的整数。结合第一方面,在第一方面的某些实现方式中,所述根据所述当前帧的前T帧的多声道参数,确定所述当前帧的多声道参数,包括:将所述前T帧的多声道参数确定为所述当前帧的多声道参数,其中,T等于1。结合第一方面,在第一方面的某些实现方式中,所述根据所述当前帧的前T帧的多声道参数,确定所述当前帧的多声道参数,包括:根据所述前T帧的多声道参数的变化趋势,确定所述当前帧的多声道参数,其中,T大于或等于2。结合第一方面,在第一方面的某些实现方式中,所述特征参数包括所述当前帧的相关性参数和峰均比参数中的至少一个,所述相关性参数用于表征所述当前帧与所述当前帧的前一帧的相关程度,所述峰均比参数用于表征所述当前帧的多声道信号中的至少一个声道的信号的峰均比,所述第二预设条件为所述特征参数大于预设阈值。结合第一方面,在第一方面的某些实现方式中,所述当前帧的初始多声道参数包括以下中的至少一种:所述当前帧的初始声道间相关性IC值,所述当前帧的初始声道间时间差ITD值,所述当前帧的初始声道间相位差IPD值,当前帧的初始整体相位差OPD值,以及所述当前帧的初始声道间电平差ILD值。结合第一方面,在第一方面的某些实现方式中,所述当前帧的特征参数包括所述当前帧的以下中的至少一种:相关性参数,峰均比参数,信噪比参数,以及谱倾斜参数,所述相关性参数用于表征所本文档来自技高网
...
多声道信号的编码方法和编码器

【技术保护点】
一种多声道信号的编码方法,其特征在于,包括:获取当前帧的多声道信号;确定所述当前帧的初始多声道参数;根据所述当前帧的初始多声道参数,以及所述当前帧的前K帧的多声道参数,确定差异参数,所述差异参数用于表征所述当前帧的初始多声道参数与所述前K帧的多声道参数的差异,其中,K为大于或等于1的整数;根据所述差异参数和所述当前帧的特征参数,确定所述当前帧的多声道参数;根据所述当前帧的多声道参数对所述多声道信号进行编码。

【技术特征摘要】
1.一种多声道信号的编码方法,其特征在于,包括:获取当前帧的多声道信号;确定所述当前帧的初始多声道参数;根据所述当前帧的初始多声道参数,以及所述当前帧的前K帧的多声道参数,确定差异参数,所述差异参数用于表征所述当前帧的初始多声道参数与所述前K帧的多声道参数的差异,其中,K为大于或等于1的整数;根据所述差异参数和所述当前帧的特征参数,确定所述当前帧的多声道参数;根据所述当前帧的多声道参数对所述多声道信号进行编码。2.如权利要求1所述的方法,其特征在于,所述根据所述差异参数和所述当前帧的特征参数,确定所述当前帧的多声道参数,包括:在所述差异参数满足第一预设条件的情况下,根据所述当前帧的特征参数,确定所述当前帧的多声道参数。3.如权利要求2所述的方法,其特征在于,所述差异参数为所述当前帧的初始多声道参数和所述当前帧的前一帧的多声道参数的差值的绝对值,所述第一预设条件为所述差异参数大于预设的第一阈值。4.如权利要求2所述的方法,其特征在于,所述差异参数为所述当前帧的初始多声道参数和所述当前帧的前一帧的多声道参数的乘积,所述第一预设条件为所述差异参数小于或等于0。5.如权利要求2-4中任一项所述的方法,其特征在于,所述根据所述当前帧的特征参数,确定所述当前帧的多声道参数,包括:根据所述当前帧的相关性参数,确定所述当前帧的多声道参数,其中,所述相关性参数用于表征所述当前帧与所述当前帧的前一帧的相关程度。6.如权利要求5所述的方法,其特征在于,所述方法还包括:根据所述当前帧的多声道信号中的目标声道信号,以及所述前一帧的多声道信号中的目标声道信号,确定所述相关性参数。7.如权利要求6所述的方法,其特征在于,所述根据所述当前帧的多声道信号中的目标声道信号,以及所述前一帧的多声道信号中的目标声道信号,确定所述相关性参数,包括:根据所述当前帧的多声道信号中的目标声道信号的频域参数,以及所述前一帧的多声道信号中的目标声道信号的频域参数,确定所述相关性参数,所述频域参数为所述目标声道信号的频域幅度值和频域系数中的至少一个。8.如权利要求5所述的方法,其特征在于,所述方法还包括:根据所述当前帧的基音周期,以及所述前一帧的基音周期,确定所述相关性参数。9.如权利要求2-8中任一项所述的方法,其特征在于,所述根据所述当前帧的特征参数,确定所述当前帧的多声道参数,包括:在所述特征参数满足第二预设条件的情况下,根据所述当前帧的前T帧的多声道参数,确定所述当前帧的多声道参数,T为大于或等于1的整数。10.如权利要求9所述的方法,其特征在于,所述根据所述当前帧的前T帧的多声道参数,确定所述当前帧的多声道参数,包括:将所述前T帧的多声道参数确定为所述当前帧的多声道参数,其中,T等于1。11.如权利要求9所述的方法,其特征在于,所述根据所述当前帧的前T帧的多声道参数,确定所述当前帧的多声道参数,包括:根据所述前T帧的多声道参数的变化趋势,确定所述当前帧的多声道参数,其中,T大于或等于2。12.如权利要求9-11中任一项所述的方法,其特征在于,所述当前帧的特征参数包括所述当前帧的相关性参数和峰均比参数中的至少一个,所述相关性参数用于表征所述当前帧与所述当前帧的前一帧的相关程度,所述峰均比参数用于表征所述当前帧的多声道信号中的至少一个声道的信号的峰均比,所述第二预设条件为所述特征参数大于预设阈值。13.如权利要求1-12中任一项所述的方法,其特征在于,所述当前帧的初始多声道参数包括以下中的至少一种:所述当前帧的初始声道间相关性IC值,所述当前帧的初始声道间时间差ITD值,所述当前帧的初始声道间相位差IPD值,当前帧的初始整体相位差OPD值,以及所述当前帧的初始声道间电平差ILD值。14.如权利要求1-13中任一项所述的方法,其特征在于,所述当前帧的特征参数包括所述当前帧的以下中的至少一种:相关性参数,峰均比参数,信噪比参数,以及谱倾斜参数,所述相关性参数用于表征所述当前帧与所述前一帧的相关程度,所述峰均比参数用于表征所述当前帧的多声道信号中的至少一个声道的信号的峰均比,所述信噪比参数用于表征所述当前帧的多声道信号中的至少一个声道的信号的信噪比,所述...

【专利技术属性】
技术研发人员:刘泽新张兴涛李海婷苗磊
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1