音频编码和音频解码制造技术

技术编号:33364052 阅读:18 留言:0更新日期:2022-05-11 22:21
一种装置,包括用于执行以下操作的部件:接收多通道音频信号(110);识别(132)至少一个音频信号以从该多通道音频信号(110)中分离;基于所识别的至少一个音频信号,将该多个音频信号至少分离(133)成第一音频信号子集(111)和第二音频信号子集(112),其中,该第一子集(111)包括所识别的至少一个音频信号,该第二子集(112)包括所接收的多通道音频信号(110)中的剩余音频信号;分析(152)该第二音频信号子集(112)中的剩余音频信号以确定一个或多个传输音频信号(151)以及元数据(153);以及对该至少一个音频信号、一个或多个传输音频信号以及元数据进行编码(140,154)。154)。

【技术实现步骤摘要】
【国外来华专利技术】音频编码和音频解码


[0001]本公开的实施例涉及音频编码和音频解码。特别地,本公开的实施例涉及对多通道音频信号进行编码以及还对其进行解码以获得多通道音频信号。

技术介绍

[0002]多通道音频信号包括多个音频信号。
[0003]为了存储或传输多通道音频信号,期望通过编码来对多通道音频信号进行压缩。

技术实现思路

[0004]根据各种但并非所有实施例,提供了一种装置,其包括用于执行以下操作的部件:
[0005]接收多通道音频信号;
[0006]识别至少一个音频信号以从该多通道音频信号中分离;
[0007]基于所识别的至少一个音频信号,将该多个音频信号至少分离成第一音频信号子集和第二音频信号子集,其中,该第一子集包括所识别的至少一个音频信号,该第二子集包括所接收的多通道音频信号中的剩余音频信号;
[0008]分析该第二音频信号子集中的剩余音频信号以确定一个或多个传输音频信号以及元数据;以及
[0009]对该至少一个音频信号、一个或多个传输音频信号以及元数据进行编码。
[0010]在一些但并非所有示例中,第一音频信号子集是多个音频信号的固定子集,并且第二音频信号子集是多个音频信号的固定子集。
[0011]在一些但并非所有示例中,第一子集包括中央扬声器通道信号和/或一对立体声通道信号,和/或第一音频通道子集包括一个或多个主导语音音频通道信号。
[0012]在一些但并非所有示例中,第一音频信号子集是多个音频信号的可变子集,并且第二音频信号子集是多个音频信号的可变子集。
[0013]在一些但并非所有示例中,第一音频信号子集的计数是可变的,和/或第一音频信号子集的组成是可变的。
[0014]在一些但并非所有示例中,第一音频信号子集是被确定为满足第一准则的信号,并且第二音频信号子集是被确定为不满足第一准则的信号。
[0015]在一些但并非所有示例中,第一准则取决于音频信号的一个或多个第一音频特性,第一音频信号子集具有并共享一个或多个第一音频特性,并且第二音频信号子集不具有一个或多个第一音频特性。
[0016]在一些但并非所有示例中,第一准则取决于音频信号的一个或多个频谱特性,第一音频信号子集中的至少一些音频信号共享一个或多个频谱特性,并且第二音频信号子集不共享一个或多个频谱特性。
[0017]在一些但并非所有示例中,一个或多个第一音频特性包括音频信号的能量级别,并且第一音频信号子集中的每个音频信号具有比第二音频信号子集中的任何一个音频信
号大的能量级别。
[0018]在一些但并非所有示例中,一个或多个第一音频特性包括音频信号相关性,并且第一音频信号子集中的每个音频信号与第一子集中的音频信号的互相关性比与第二子集中的音频信号的互相关性大。
[0019]在一些但并非所有示例中,一个或多个第一音频特性包括音频信号去相关性,并且第一音频信号子集中的至少一些音频信号与第一子集中的其他音频信号和与第二子集中的音频信号都具有低互相关性。
[0020]在一些但并非所有示例中,一个或多个第一音频特性包括由音频分类器定义的音频特性,并且第一音频信号子集中的至少一些音频信号传达语音,第二子集中的音频信号不传达语音。
[0021]在一些但并非所有示例中,多通道音频信号包括多个音频信号,其中,每个音频信号用于经由不同的输出通道渲染音频。
[0022]在一些但并非所有示例中,第一子集的计数取决于可用带宽。
[0023]在一些但并非所有示例中,分析第二音频信号子集中的剩余音频信号以确定传输音频信号和元数据包括:分析第二音频信号子集而不是第一音频信号子集。
[0024]在一些但并非所有示例中,元数据对第二音频信号子集的时频部分进行参数化。
[0025]在一些但并非所有示例中,元数据至少对由第二音频信号子集定义的声场的空间能量分布进行编码。
[0026]在一些示例中,上述分析是参数化空间分析,其产生参数化和空间化两者的元数据,其中,该参数化空间分析对第二音频信号子集的时频部分进行参数化,并至少部分地对至少由第二音频信号子集定义的声场的空间能量分布进行编码。
[0027]在一些但并非所有示例中,元数据至少对由第二音频信号子集定义的声场的空间能量分布进行编码。
[0028]在一些但并非所有示例中,该装置包括用于提供控制信息的部件,该控制信息至少识别多个音频信号中的被包括在第一音频信号子集中的音频信号。
[0029]在一些但并非所有示例中,控制信息至少识别通过分析而产生的经处理的音频信号。
[0030]在一些但并非所有示例中,对第二音频信号子集的分析提供一个或多个经处理的音频信号和元数据,其中,该一个或多个经处理的音频信号和元数据与第一音频信号子集一起被联合编码,或者该一个或多个经处理的音频信号和元数据被联合编码但与第一音频信号子集分开被编码。
[0031]根据各种但并非所有实施例,提供了一种包括对多通道音频信号进行编码的方法,其包括:
[0032]识别至少一个音频信号以从该多通道音频信号中分离;
[0033]基于所识别的至少一个音频信号,将该多个音频信号至少分离成第一音频信号子集和第二音频信号子集,其中,该第一子集包括所识别的至少一个音频信号,该第二子集包括所接收的多通道音频信号中的剩余音频信号;
[0034]分析该第二音频信号子集中的剩余音频信号以确定一个或多个传输音频信号以及元数据;以及
[0035]对该至少一个音频信号、一个或多个传输音频信号以及元数据进行编码。
[0036]根据各种但并非所有实施例,提供了一种计算机程序,其包括用于使装置至少执行以下操作的程序指令:
[0037]识别至少一个音频信号以从多通道音频信号中分离;
[0038]基于所识别的至少一个音频信号,将该多个音频信号至少分离成第一音频信号子集和第二音频信号子集,其中,该第一子集包括所识别的至少一个音频信号,该第二子集包括所接收的多通道音频信号中的剩余音频信号;
[0039]分析该第二音频信号子集中的剩余音频信号以确定一个或多个传输音频信号以及元数据;以及
[0040]使得能够对该至少一个音频信号、一个或多个传输音频信号以及元数据进行编码。
[0041]根据各种但并非所有实施例,提供了一种装置,其包括用于执行以下操作的部件:
[0042]接收编码数据以用于解码,该编码数据包括至少一个音频信号、一个或多个传输音频信号以及元数据;
[0043]对所接收的编码数据进行解码,以解码该至少一个音频信号、一个或多个传输音频信号以及元数据;
[0044]对经解码的一个或多个传输音频信号和经解码的元数据进行合成,以提供一组音频信号;
[0045]识别该至少一个音频信号和/或该组音频信号的多通道索引;以及
[0046]使用该索引来至少组合经解码的至少一个音频信号和该组音频信号,以提供多本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种装置,包括用于执行以下操作的部件:接收多通道音频信号;识别至少一个音频信号以从所述多通道音频信号中分离;基于所识别的至少一个音频信号,将所述多个音频信号至少分离成第一音频信号子集和第二音频信号子集,其中,所述第一子集包括所识别的至少一个音频信号,所述第二子集包括所接收的多通道音频信号中的剩余音频信号;分析所述第二音频信号子集中的所述剩余音频信号以确定一个或多个传输音频信号以及元数据;以及对所述至少一个音频信号、所述一个或多个传输音频信号以及所述元数据进行编码。2.根据权利要求1所述的装置,其中,所述第一音频信号子集是所述多个音频信号的固定子集,并且所述第二音频信号子集是所述多个音频信号的固定子集。3.根据权利要求2所述的装置,其中,所述第一子集包括中央扬声器通道信号和/或一对立体声通道信号,和/或所述第一音频通道子集包括一个或多个主导语音音频通道信号。4.根据权利要求1所述的装置,其中,第一音频信号子集是所述多个音频信号的可变子集,并且所述第二音频信号子集是所述多个音频信号的可变子集。5.根据权利要求4所述的装置,其中,所述第一音频信号子集的计数是可变的,和/或其中,所述第一音频信号子集的组成是可变的。6.根据权利要求1、4或5中任一项所述的装置,其中,所述第一音频信号子集是被确定为满足第一准则的信号,并且所述第二音频信号子集是被确定为不满足所述第一准则的信号。7.根据权利要求6所述的装置,其中,所述第一准则取决于所述音频信号的一个或多个第一音频特性,其中,所述第一音频信号子集共享所述一个或多个第一音频特性,并且所述第二音频信号子集不共享所述一个或多个第一音频特性。8.根据权利要求6或7所述的装置,其中,所述第一准则取决于所述音频信号的一个或多个频谱特性,其中,所述第一音频信号子集中的至少一些音频信号共享所述一个或多个频谱特性,并且所述第二音频信号子集不共享所述一个或多个频谱特性。9.根据权利要求7或8所述的装置,其中,所述一个或多个第一音频特性包括音频信号的能量级别,其中,所述第一音频信号子集中的每个音频信号具有比所述第二音频信号子集中的任何一个音频信号大的能量级别。10.根据权利要求7或8所述的装置,其中,所述一个或多个第一音频特性包括音频信号相关性,其中,所述第一音频信号子集中的每个音频信号与所述第一子集中的音频信号的互相关性比与所述第二子集中的音频信号的互相关性大,或者其中,所述一个或多个第一音频特性包括音频信号去相关性,其中,所述第一音频信号子集中的至少一些音频信号与所述第一子集中的其他音频信号和与所述第二子集中的音频信号都具有低互相关性,或者其中,所述一个或多个第一音频特性包括由音频分类器定义的音频特性,其中,所述第一音频信号子集中的至少一些音频信号传达语音,所述第二子集中的音频信号不传达语音。11.根据前述权利要求中任一项所述的装置,其中,所述多通道音频信号包括多个音频
信号,其中,每个音频信号用于经由不同的输出通道渲染音频。12.根据前述权利要求中任一项所述的装置,其中,所述第一子集的所述计数取决于可用带宽。13.根据前述权利要求中任一项所述的装置,其中,分析所述第二音频信号子集中的所述剩余音频信号以确定传输音频信号和元数据包括:分析所述第二音频信号子集而不是所述第一音频信号子集。14.根据权利要求13所述的装置,其中,所述元数据对所述第二音频信号子集的时频部分进行参数化。15.根据权利要求13或14中任一项所述的装置,其中,所述元数据至少对由所述第二音频信号子集定义的声场的空间能量分布进行编码。16.根据前述权利要求中任一项所述的装置,其中,所述装置包括用于提供...

【专利技术属性】
技术研发人员:MV
申请(专利权)人:诺基亚技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1