音频编码器和解码器制造技术

技术编号:15072569 阅读:228 留言:0更新日期:2017-04-06 18:48
本公开落入音频编码领域,特别地,本公开涉及其中音频信息由多个信号表示的空间音频编码领域,其中,信号可以包括音频声道和/或音频对象。特别地,本公开提供了一种用于在音频解码系统中重构音频对象的方法和设备。此外,本公开提供了一种用于对这种音频对象进行编码的方法和装置。

Audio encoder and decoder

The present disclosure falls into the field of audio coding, in particular, the present invention relates to a spatial audio coding field wherein audio information is represented by a plurality of signals, wherein the signal may include audio channels and / or audio objects. In particular, the present invention provides a method and apparatus for reconstructing an audio object in an audio decoding system. In addition, the present invention provides a method and a device for encoding the audio object.

【技术实现步骤摘要】
【国外来华专利技术】对相关申请的交叉引用本申请要求2013年10月21日提交的美国临时专利申请No.61/893770和2014年4月1日提交的美国临时专利申请No.61/973653的优先权,其全部内容通过引用并入于此。
本公开落入音频编码领域,特别地,本公开涉及音频信息由多个信号表示的空间音频编码领域,其中信号可以包括音频声道和/或音频对象。特别地,本公开提供一种用于在音频解码系统中重构音频对象的方法和装置。此外,本公开提供一种用于对这种音频对象进行编码的方法和装置。
技术介绍
在常规的音频系统中,利用基于声道的方法。每个声道可以例如表示一个扬声器或一个扬声器阵列的内容。用于这种系统的可能的编码方案包括离散多声道编码或诸如MPEG环绕声之类的参数化编码。最近,已经开发出了新的方法。该方法是基于对象的,当对例如电影院应用中的复杂音频场景进行编码时,该方法可能是有利的。在利用基于对象的方法的系统中,三维音频场景由音频对象及其相关联的元数据(例如,位置元数据)表示。这些音频对象在音频信号的回放期间在三维音频场景中四处移动。该系统还可以包括所谓的床声道,这些床声道可以被描述为直接映射到例如如上所述的常规音频系统的某些输出声道的信号。在基于对象的音频系统中可能出现的问题是如何高效地对对象音频信号进行编码和解码并且保持编码信号的质量。可能的编码方案在编码器侧包括用于创建下混信号的部件和用于生成副信息的部件,其中,下混信号包括从音频对象和床声道获得的若干个声道,并且副信息有助于音频对象和床声道在解码器侧的重构。MPEG空间音频对象编码(MPEGSAOC)描述用于音频对象的参数化编码的系统。该系统发送通过诸如对象的水平差异和互相关之类的参数来描述对象的性质的副信息,即,上混矩阵。这些参数然后被用来控制音频对象在解码器侧的重构。该过程在数学上可能是复杂的,并且经常必须依赖关于未被参数明确地描述的音频对象性质的假设。MPEGSAOC中呈现的方法可以降低基于对象的音频系统所需的比特率,但是如上所述,可能需要进一步的改进来进一步提高效率和质量。附图说明现在将参照附图来描述示例性实施例,其中:图1是根据示例性实施例的用于重构音频对象的解码器的概扩框图;图2描述了根据第一解码模式对上混矩阵的解码;图3描述了根据第一解码模式对上混矩阵的解码;图4描述了根据第二解码模式对上混矩阵的解码;图5描述了用于重构包括多个频带的时间帧中的音频对象的方法;图6描述了用于对包括多个频带的时间帧中的音频对象进行编码的方法,该方法具有第一和第二编码模式;图7是根据示例性实施例的用于对音频对象进行编码的编码器的概括框图;图8以举例的方式描述了指示符矢量的熵编码。所有的图都是示意性的,并且一般仅示出了阐明本公开所必要的部分,而其他部分可能被省略或者仅被暗示。除非另有指明,否则在不同的图中,相同的附图标记指代相同的部分。具体实施方式鉴于以上,目的是提供旨在优化编码音频对象的编码功效和重构质量之间的权衡的编码器和解码器以及相关联的方法。I.概述-解码器根据第一方面,示例性实施例提出了用于解码的解码方法、解码器和计算机程序产品。所提出的方法、解码器和计算机程序产品一般可以具有相同的特征和优点。根据示例性实施例,提供了一种用于重构包括多个频带的时间帧中的音频对象的方法。该方法包括以下步骤:接收M>1个下混信号,每个下混信号是包含所述音频对象的多个音频对象的组合;并且接收包括第一指示符的指示符,第一指示符指示当重构音频对象时所述M个下混信号中的哪些下混信号要用在所述多个频带中。在第一解码模式中,每个第一指示符指示当重构音频对象时要用于所述多个频带的全部频带的下混信号。该方法还包括以下步骤:接收各自与频带和由第一指示符指示的用于该频带的下混信号相关联的第一参数;并且通过形成至少所述由第一指示符指示的用于该频带的下混信号的加权和来重构所述多个频带中的音频对象,其中,每个下混信号根据其相关联的第一参数而被加权。该方法的优点是降低了发送用于从至少M个下混信号重构音频对象的参数所需的比特率,因为实现该方法的解码器仅需要接收用于由指示符指示的下混信号的参数。该方法的另一优点是可以降低重构音频对象的复杂度,因为指示符指示在任何给定时间帧中什么参数用于重构。结果,可以避免不必要的与零相乘。仅使用一个用于指示当重构音频对象时应被用于多个频带的全部频带的下混信号的指示符的优点是可以降低发送指示符所需的比特率。根据实施例,所述方法还包括以下步骤:形成K≥1个去相关信号,其中,指示符还包括第二指示符,第二指示符指示当重构音频对象时所述K个去相关信号中的哪些去相关要用在所述多个频带中。在第一解码模式中,每个第二指示符指示当重构音频对象时要用于所述多个频带的全部频带的去相关信号。所述方法还包括以下步骤:接收各自与频带和由第二指示符指示的用于该频带的去相关信号相关联的第二参数。重构所述多个频带中的音频对象的步骤还包括:把由第二指示符指示的用于特定频带的去相关信号的加权和加到用于该特定频带的下混信号的加权和,其中,每个去相关信号根据其相关联的第二参数而被加权。通过当重构音频对象时使用去相关信号,可以降低被重构的音频对象之间的任何不需要的相关性。根据实施例,指示符是以二进制矢量的形式接收的,该二进制矢量的每个元素对应于M个下混信号或K个去相关信号(如果适用的话)中的一个。以二进制矢量的形式接收指示符的优点是可以提供从以比特流的形式接收的数据的简单转换。根据实施例,通过熵编码对所接收的二进制矢量进行编码。这可以进一步降低发送指示符所需的比特率。根据实施例,所述方法包括第二解码模式。在第二解码模式中,用于每个频带的指示符指示当重构音频对象时M个下混信号或K个去相关信号(如果适用的话)中要用在该频带中的单个信号。该解码模式可以导致发送参数所需的比特率降低,因为对于要重构的音频对象的每个频带,只需要发送单个参数。根据实施例,指示符是以整数矢量的形式接收的,其中,该整数矢量中的每个元素对应于频带和要用于该频带的单个下混信号的指标。这可以是指示对于特定频带要使用什么下混信号的高效方式。整数矢量可以进一步有助于对由解码器接收的比特流中的指示符进行高效的编码。根据实施例,可以本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/CN105659320.html" title="音频编码器和解码器原文来自X技术">音频编码器和解码器</a>

【技术保护点】
一种用于重构包括多个频带的时间帧中的音频对象的方法,包括:接收M>1个下混信号,每个下混信号是包括所述音频对象的多个音频对象的组合;接收包括第一指示符的指示符,所述第一指示符指示当重构所述音频对象时所述M个下混信号中的哪些下混信号要用在所述多个频带中,其中,在第一解码模式中,每个第一指示符指示当重构所述音频对象时要用于所述多个频带的全部频带的下混信号;接收各自与频带和由第一指示符指示的用于该频带的下混信号相关联的第一参数;通过形成至少所述由第一指示符指示的用于该频带的下混信号的加权和来重构所述多个频带中的所述音频对象,其中,每个下混信号根据其相关联的第一参数而被加权。

【技术特征摘要】
【国外来华专利技术】2013.10.21 US 61/893,770;2014.04.01 US 61/973,6531.一种用于重构包括多个频带的时间帧中的音频对象的方法,包
括:
接收M>1个下混信号,每个下混信号是包括所述音频对象的多个
音频对象的组合;
接收包括第一指示符的指示符,所述第一指示符指示当重构所述
音频对象时所述M个下混信号中的哪些下混信号要用在所述多个频
带中,
其中,在第一解码模式中,每个第一指示符指示当重构所述音频
对象时要用于所述多个频带的全部频带的下混信号;
接收各自与频带和由第一指示符指示的用于该频带的下混信号相
关联的第一参数;
通过形成至少所述由第一指示符指示的用于该频带的下混信号的
加权和来重构所述多个频带中的所述音频对象,其中,每个下混信号
根据其相关联的第一参数而被加权。
2.根据权利要求1所述的方法,还包括:
形成K≥1个去相关信号,其中,所述指示符还包括第二指示符,
所述第二指示符指示当重构所述音频对象时所述K个去相关信号中的
哪些去相关信号要用在所述多个频带中,
其中,在所述第一解码模式中,每个第二指示符指示当重构所述
音频对象时要用于所述多个频带的全部频带的去相关信号;
接收各自与频带和由第二指示符指示的用于该频带的去相关信号
相关联的第二参数,
其中,重构所述多个频带中的所述音频对象的步骤还包括:将由
第二指示符指示的用于特定频带的去相关信号的加权和加到用于该特
定频带的下混信号的加权和,其中,每个去相关信号根据其相关联的
第二参数而被加权。
3.根据权利要求1或2所述的方法,其中,所述指示符以二进制
矢量的形式被接收,所述二进制矢量的每个元素均对应于适用的K个
去相关信号或M个下混信号中的一个信号。
4.根据权利要求3所述的方法,其中,通过熵编码对所接收的二
进制矢量进行编码。
5.根前述权利要求中的任一项所述的方法,其中,在第二解码模
式中,用于每个频带的指示符指示当重构所述音频对象时适用的K个
去相关信号或M个下混信号中要用在所述频带中的单个信号。
6.根据权利要求5所述的方法,其中,所述指示符以整数矢量的
形式被接收,其中,所述整数矢量中的每个元素均对应于频带和要用
于该频带的单个下混信号的指标。
7.根据权利要求6所述的方法,其中,通过熵编码对所接收的整
数矢量进行编码。
8.根据权利要求5-7中的任一项所述的方法,还包括:
接收解码模式参数,所述解码模式参数指示要使用所述第一解码
模式和第二解码模式中的哪个。
9.根据前述权利要求中的任一项所述的方法,其中,所述指示符
与所述参数分开接收。
10.根据前述权利要求中的任一项所述的方法,其中,通过时间
差分编码和/或频率差分编码对所接收的适用的第二参数和第一参数
中的至少一些进行编码。
11.根据前述权利要求中的任一项所述的方法,其中,通过熵编
码对适用的第二参数和第一参数进行编码。
12.一种计算机程序产品,包括具有用于执行权利要求1-11中的
任一项所述的方法的指令的计算机可读介质。
13.一种用于重构包括多个频带的时间帧中的音频对象的解码器,
包括:
接收级,被配置用于:
接收M>1个下混信号,每个下混信号是包括所述音频对象的
多个音频对象的组合;
接收包括第一指示符的指示符,所述第一指示符指示当重构
所述音频对象时所述M个下混信号中的...

【专利技术属性】
技术研发人员:H·普恩哈根J·克里萨L·维勒莫斯T·赫冯恩
申请(专利权)人:杜比国际公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1