多声道音频信号的去相关编码方法和装置制造方法及图纸

技术编号:15439049 阅读:96 留言:0更新日期:2017-05-26 04:50
本发明专利技术涉及一种多声道音频信号的去相关编码方法和装置。本发明专利技术的去相关编码方法利用多声道音频信号的声道间相关性,通过自适应的声道配置结构和自适应的声道单元编码方式进行编码,可以在低复杂度条件下有效地去除声道间的冗余,从而获得较高的编码增益。本发明专利技术比M/S编码效率高,比正交变换编码或预测编码实现简单,适用于超高清电视的3D音频系统或者其他需要3D音频的应用领域。

Decorrelation coding method and device for multi-channel audio signal

The invention relates to a decorrelation encoding method and a device for multi-channel audio signals. Related to the encoding method using multi-channel audio signal channel correlation by encoding channel configuration and adaptive channel adaptive encoding unit, can effectively remove the redundancy in the low complexity channel between the degree of conditions, to get a high encoding gain. The invention has higher coding efficiency than M/S, and is simpler to realize than the orthogonal transform coding or predictive coding, and is suitable for the 3D audio system of ultra high definition television or other application fields requiring 3D audio.

【技术实现步骤摘要】
多声道音频信号的去相关编码方法和装置
本专利技术涉及数字音频编码技术,更具体地说,涉及一种多声道音频信号的去相关编码方法和装置。
技术介绍
随着超高清电视等应用的发展,对于音频的要求也进一步提高,以便获得身临其境的沉浸式听觉效果。为此,输入音频信号的声道数明显增多(例如5.1.4、7.1.4和22.2等),这就使得音频声道信号在空间中的密度增大,相应的声道间的冗余也会增加,因此去除声道间的冗余来提高压缩效率成为3D音频编码的关键技术之一。当前数字音频编码中对于声道间的冗余处理技术已经有几种经典的方法。这些方法都可以实现无损伤(无失真)压缩多声道(包含立体声)数字音频信号的目的,可以作为传统感觉音频编码技术的预处理模块,可以在时域进行冗余处理,也可以在变换域进行冗余处理。第一种已有的声道间冗余处理技术是M/S(Middle/Side)立体声编码技术。对于输入立体声信号,如L(左声道)和R(右声道),M/S立体声编码是对这个声道对进行冗余度压缩,其算法如下:M=L+RS=L-R或者通过处理(如延时或增益调整等)之后再进行以上运算。如果左右声道(或一个声道对)之间相关性较强,那么一般情况下差声道S的动态范围大大降低,其方差值与原来右声道比小很多,这样后面感觉编码通常可以使用更少的比特来编码,而提高总的编码效率。M/S立体声编码技术仅仅适合于一对输入声道的冗余去除。当输入音频信号具有更多声道时,也只能对多个声道分别配成几个声道对的方式进行编码,例如5.1声道时,如图1所示,L和R一对,LS(左环绕)和RS(右环绕)一对。然而,当输入为5.1声道时,有时L和LS之间也有相关性,R和RS之间同样有相关性,M/S立体声编码没有考虑后面的这种冗余去除情况。而当输入为3D音频信号时,通常输入包括:9.1(5.1.4)声道:在5.1声道基础上,在L、R、LS和RS上方增加4个声道;11.1(7.1.4)声道:在7.1声道基础上,在L、R、LS和RS上方增加4个声道;22.2模式:扬声器具有三层配置结构,如图2所示,顶层有9个声道,中间层有10个声道,底层有3个声道,还具有两个LFE(低频增强)声道。当输入音频信号为以上声道模式时,如果仅仅以声道对方式进行M/S编码,并没有充分利用各个声道间的相关性去除冗余信息。第二种已有的声道间冗余处理技术是正交变换编码。通过正交变换去除声道间相关的方法,可以较好地去除声道间的冗余度,但是由于每帧需要计算正交变换的矩阵,非常复杂;而且随着声道数增加,复杂度急剧增加。另外变化系数矩阵也需要编码传输给解码端,从而可能使得总的编码效率并不高。例如输入音频信号为2声道立体声时,需要一个2x2的矩阵;而5.1声道时需要一个5x5矩阵(低音声道不处理);22.2声道时,需要一个22x22的矩阵(2个低音声道不处理)。定义系数矩阵为M,则输出与输入之间的关系如下:Y=MX其中X为输入向量,一般是长度为2048点的PCM信号。对于每帧输入信号X,系数矩阵M的计算一般可通过各个声道间的相关计算出来。第三种已有的声道间冗余处理技术是声道间预测编码。通过声道间预测也可以去除声道间的冗余,这种方法理论上和正交变换方法相似。由于滤波器系数计算比较复杂(特别是声道增多时),同时会带来预测滤波运算的延时,并且还要求传输滤波器系数而可能使得总编码效率不高等原因,因此这种方法在实际的感觉音频编码中一般不会使用。
技术实现思路
本专利技术要解决的技术问题在于,针对现有技术的上述M/S编码相对简单但是一般声道对的结构不能自适应、编码效率低,正交变换编码和预测编码实现都过于复杂且可能带来延时等问题,提供一种可在低复杂度条件下较好地去除声道间的冗余度、获得较高的编码增益的多声道音频信号的去相关编码方法和装置。本专利技术为解决其技术问题在第一方面提出一种多声道音频信号的去相关编码方法,包括如下步骤:S1、根据输入的多声道音频信号的声道模式构建声道对并对每一声道对进行相关性分析,选择其中最相关的一对声道作为第一个2声道单元,选择剩余声道中最相关的一对声道作为第二个2声道单元,以此类推形成第一层编码结构的所有2声道单元,并为每个2声道单元自适应地选择效率最高的编码模式;S2、分析编码输出的2声道单元之间的相关性,选择其中最相关的一对2声道单元作为第一个4声道单元,选择剩余2声道单元中最相关的一对2声道单元作为第二个4声道单元,以此类推形成第二层编码结构的所有4声道单元,并为每个4声道单元自适应地选择效率最高的编码模式;S3、以此类推形成更高一层编码结构的多声道单元,并为每个多声道单元自适应地选择效率最高的编码模式,直至达到预定的某一层编码结构;S4、按照所述步骤S1-S3中确定的编码结构和编码模式对输入的多声道音频信号进行编码,得到去除声道间冗余的编码信号,并将所述编码结构和编码模式作为参数嵌入到所述编码信号中输出。根据本专利技术第一方面的一个实施例中,所述步骤S1中根据输入的多声道音频信号的声道模式构建声道对进一步包括:对于与其他声道相关性较小的某一个或多个声道不参与声道对的构建而直接输出,以保留偶数个声道进行声道对的构建。根据本专利技术第一方面的一个实施例中,所述步骤S1中根据输入的多声道音频信号的声道模式构建声道对进一步包括:将在空间上相邻的两个声道构建成声道对。根据本专利技术第一方面的一个实施例中,所述步骤S1-S3中为每个2/4/多声道单元自适应地选择效率最高的编码模式进一步包括:为构成更高一层编码结构的多声道单元的两个多声道单元选择相同的编码模式。根据本专利技术第一方面的一个实施例中,所述编码模式包括M/S编码和MCR编码。本专利技术为解决其技术问题在第二方面提出一种多声道音频信号的去相关编码装置,包括:自适应结构和模式确定模块,用于根据输入的多声道音频信号的声道模式构建声道对并对每一声道对进行相关性分析,选择其中最相关的一对声道作为第一个2声道单元,选择剩余声道中最相关的一对声道作为第二个2声道单元,以此类推形成第一层编码结构的所有2声道单元,并为每个2声道单元自适应地选择效率最高的编码模式;分析编码输出的2声道单元之间的相关性,选择其中最相关的一对2声道单元作为第一个4声道单元,选择剩余2声道单元中最相关的一对2声道单元作为第二个4声道单元,以此类推形成第二层编码结构的所有4声道单元,并为每个4声道单元自适应地选择效率最高的编码模式;以此类推形成更高一层编码结构的多声道单元,并为每个多声道单元自适应地选择效率最高的编码模式,直至达到预定的某一层编码结构;编码模块,用于按照所述自适应结构和模式确定模块确定的编码结构和编码模式对输入的多声道音频信号进行编码,得到去除声道间冗余的编码信号,并将所述编码结构和编码模式作为参数嵌入到所述编码信号中输出。根据本专利技术第二方面的一个实施例中,所述自适应结构和模式确定模块根据输入的多声道音频信号的声道模式构建声道对进一步包括:对于与其他声道相关性较小的某一个或多个声道不参与声道对的构建而直接输出,以保留偶数个声道进行声道对的构建。根据本专利技术第二方面的一个实施例中,所述自适应结构和模式确定模块根据输入的多声道音频信号的声道模式构建声道对进一步包括:将在空间上相邻的两个声道构建成声道对。根据本专利技术第二方面的一个实本文档来自技高网
...
多声道音频信号的去相关编码方法和装置

【技术保护点】
一种多声道音频信号的去相关编码方法,其特征在于,包括如下步骤:S1、根据输入的多声道音频信号的声道模式构建声道对并对每一声道对进行相关性分析,选择其中最相关的一对声道作为第一个2声道单元,选择剩余声道中最相关的一对声道作为第二个2声道单元,以此类推形成第一层编码结构的所有2声道单元,并为每个2声道单元自适应地选择效率最高的编码模式;S2、分析编码输出的2声道单元之间的相关性,选择其中最相关的一对2声道单元作为第一个4声道单元,选择剩余2声道单元中最相关的一对2声道单元作为第二个4声道单元,以此类推形成第二层编码结构的所有4声道单元,并为每个4声道单元自适应地选择效率最高的编码模式;S3、以此类推形成更高一层编码结构的多声道单元,并为每个多声道单元自适应地选择效率最高的编码模式,直至达到预定的某一层编码结构;S4、按照所述步骤S1‑S3中确定的编码结构和编码模式对输入的多声道音频信号进行编码,得到去除声道间冗余的编码信号,并将所述编码结构和编码模式作为参数嵌入到所述编码信号中输出。

【技术特征摘要】
1.一种多声道音频信号的去相关编码方法,其特征在于,包括如下步骤:S1、根据输入的多声道音频信号的声道模式构建声道对并对每一声道对进行相关性分析,选择其中最相关的一对声道作为第一个2声道单元,选择剩余声道中最相关的一对声道作为第二个2声道单元,以此类推形成第一层编码结构的所有2声道单元,并为每个2声道单元自适应地选择效率最高的编码模式;S2、分析编码输出的2声道单元之间的相关性,选择其中最相关的一对2声道单元作为第一个4声道单元,选择剩余2声道单元中最相关的一对2声道单元作为第二个4声道单元,以此类推形成第二层编码结构的所有4声道单元,并为每个4声道单元自适应地选择效率最高的编码模式;S3、以此类推形成更高一层编码结构的多声道单元,并为每个多声道单元自适应地选择效率最高的编码模式,直至达到预定的某一层编码结构;S4、按照所述步骤S1-S3中确定的编码结构和编码模式对输入的多声道音频信号进行编码,得到去除声道间冗余的编码信号,并将所述编码结构和编码模式作为参数嵌入到所述编码信号中输出。2.根据权利要求1所述的多声道音频信号的去相关编码方法,其特征在于,所述步骤S1中根据输入的多声道音频信号的声道模式构建声道对进一步包括:对于与其他声道相关性较小的某一个或多个声道不参与声道对的构建而直接输出,以保留偶数个声道进行声道对的构建。3.根据权利要求1所述的多声道音频信号的去相关编码方法,其特征在于,所述步骤S1中根据输入的多声道音频信号的声道模式构建声道对进一步包括:将在空间上相邻的两个声道构建成声道对。4.根据权利要求1所述的多声道音频信号的去相关编码方法,其特征在于,所述步骤S1-S3中为每个2/4/多声道单元自适应地选择效率最高的编码模式进一步包括:为构成更高一层编码结构的多声道单元的两个多声道单元选择相同的编码模式。5.根据权利要求1所述的多声道音频信号的去相关编码方法,其特征在于,所述编码模式包括M/S编码和MCR编码。6.一种多声道音频信号的去相...

【专利技术属性】
技术研发人员:闫建新王磊
申请(专利权)人:广州广晟数码技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1