The present disclosure falls into the field of audio coding, in particular, the present invention relates to a spatial audio coding field wherein audio information is represented by a plurality of signals, wherein the signal may include audio channels and / or audio objects. In particular, the present invention provides a method and apparatus for reconstructing an audio object in an audio decoding system. In addition, the present invention provides a method and a device for encoding the audio object.
【技术实现步骤摘要】
【国外来华专利技术】对相关申请的交叉引用本申请要求2013年10月21日提交的美国临时专利申请No.61/893770和2014年4月1日提交的美国临时专利申请No.61/973653的优先权,其全部内容通过引用并入于此。
本公开落入音频编码领域,特别地,本公开涉及音频信息由多个信号表示的空间音频编码领域,其中信号可以包括音频声道和/或音频对象。特别地,本公开提供一种用于在音频解码系统中重构音频对象的方法和装置。此外,本公开提供一种用于对这种音频对象进行编码的方法和装置。
技术介绍
在常规的音频系统中,利用基于声道的方法。每个声道可以例如表示一个扬声器或一个扬声器阵列的内容。用于这种系统的可能的编码方案包括离散多声道编码或诸如MPEG环绕声之类的参数化编码。最近,已经开发出了新的方法。该方法是基于对象的,当对例如电影院应用中的复杂音频场景进行编码时,该方法可能是有利的。在利用基于对象的方法的系统中,三维音频场景由音频对象及其相关联的元数据(例如,位置元数据)表示。这些音频对象在音频信号的回放期间在三维音频场景中四处移动。该系统还可以包括所谓的床声道,这些床声道可以被描述为直接映射到例如如上所述的常规音频系统的某些输出声道的信号。在基于对象的音频系统中可能出现的问题是如何高效地对对象音频信号进行编码和解码并且保持编码信号的质量。可能的编码方案在编码器侧包括用于创建下混信号的部件和用于生成副 ...
【技术保护点】
一种用于重构包括多个频带的时间帧中的音频对象的方法,包括:接收M>1个下混信号,每个下混信号是包括所述音频对象的多个音频对象的组合;接收包括第一指示符的指示符,所述第一指示符指示当重构所述音频对象时所述M个下混信号中的哪些下混信号要用在所述多个频带中,其中,在第一解码模式中,每个第一指示符指示当重构所述音频对象时要用于所述多个频带的全部频带的下混信号;接收各自与频带和由第一指示符指示的用于该频带的下混信号相关联的第一参数;通过形成至少所述由第一指示符指示的用于该频带的下混信号的加权和来重构所述多个频带中的所述音频对象,其中,每个下混信号根据其相关联的第一参数而被加权。
【技术特征摘要】
【国外来华专利技术】2013.10.21 US 61/893,770;2014.04.01 US 61/973,6531.一种用于重构包括多个频带的时间帧中的音频对象的方法,包
括:
接收M>1个下混信号,每个下混信号是包括所述音频对象的多个
音频对象的组合;
接收包括第一指示符的指示符,所述第一指示符指示当重构所述
音频对象时所述M个下混信号中的哪些下混信号要用在所述多个频
带中,
其中,在第一解码模式中,每个第一指示符指示当重构所述音频
对象时要用于所述多个频带的全部频带的下混信号;
接收各自与频带和由第一指示符指示的用于该频带的下混信号相
关联的第一参数;
通过形成至少所述由第一指示符指示的用于该频带的下混信号的
加权和来重构所述多个频带中的所述音频对象,其中,每个下混信号
根据其相关联的第一参数而被加权。
2.根据权利要求1所述的方法,还包括:
形成K≥1个去相关信号,其中,所述指示符还包括第二指示符,
所述第二指示符指示当重构所述音频对象时所述K个去相关信号中的
哪些去相关信号要用在所述多个频带中,
其中,在所述第一解码模式中,每个第二指示符指示当重构所述
音频对象时要用于所述多个频带的全部频带的去相关信号;
接收各自与频带和由第二指示符指示的用于该频带的去相关信号
相关联的第二参数,
其中,重构所述多个频带中的所述音频对象的步骤还包括:将由
第二指示符指示的用于特定频带的去相关信号的加权和加到用于该特
定频带的下混信号的加权和,其中,每个去相关信号根据其相关联的
第二参数而被加权。
3.根据权利要求1或2所述的方法,其中,所述指示符以二进制
矢量的形式被接收,所述二进制矢量的每个元素均对应于适用的K个
去相关信号或M个下混信号中的一个信号。
4.根据权利要求3所述的方法,其中,通过熵编码对所接收的二
进制矢量进行编码。
5.根前述权利要求中的任一项所述的方法,其中,在第二解码模
式中,用于每个频带的指示符指示当重构所述音频对象时适用的K个
去相关信号或M个下混信号中要用在所述频带中的单个信号。
6.根据权利要求5所述的方法,其中,所述指示符以整数矢量的
形式被接收,其中,所述整数矢量中的每个元素均对应于频带和要用
于该频带的单个下混信号的指标。
7.根据权利要求6所述的方法,其中,通过熵编码对所接收的整
数矢量进行编码。
8.根据权利要求5-7中的任一项所述的方法,还包括:
接收解码模式参数,所述解码模式参数指示要使用所述第一解码
模式和第二解码模式中的哪个。
9.根据前述权利要求中的任一项所述的方法,其中,所述指示符
与所述参数分开接收。
10.根据前述权利要求中的任一项所述的方法,其中,通过时间
差分编码和/或频率差分编码对所接收的适用的第二参数和第一参数
中的至少一些进行编码。
11.根据前述权利要求中的任一项所述的方法,其中,通过熵编
码对适用的第二参数和第一参数进行编码。
12.一种计算机程序产品,包括具有用于执行权利要求1-11中的
任一项所述的方法的指令的计算机可读介质。
13.一种用于重构包括多个频带的时间帧中的音频对象的解码器,
包括:
接收级,被配置用于:
接收M>1个下混信号,每个下混信号是包括所述音频对象的
多个音频对象的组合;
接收包括第一指示符的指示符,所述第一指示符指示当重构
所述音频对象时所述M个下混信号中的...
【专利技术属性】
技术研发人员:H·普恩哈根,J·克里萨,L·维勒莫斯,T·赫冯恩,
申请(专利权)人:杜比国际公司,
类型:发明
国别省市:荷兰;NL
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。