针对音频声道及音频对象的音频编码及解码的概念制造技术

技术编号：15118203 阅读：100 留言：0更新日期：2017-04-09 15:46

一种音频编码器，用于编码音频输入数据(101)以取得音频输出数据(501)，其包含：输入接口(100)，用于接收多个音频声道、多个音频对象以及关于多个音频对象中的一个或多个音频对象的元数据；混合器(200)，用于混合多个对象以及多个声道以获得多个预混合声道，每一预混合声道包含声道的音频数据以及至少一个对象的音频数据；核心编码器(300)，用于核心编码核心编码器输入数据；以及元数据压缩器(400)，用于压缩关于多个音频对象中的一个或多个音频对象的元数据，其中音频编码器用于在一组两种模式的至少一个种模式下操作，该两种模式包含第一模式以及第二模式，在第一模式下该核心编码器用于编码多个音频声道和多个音频对象，多个音频声道和多个音频对象由输入接口所接收以作为核心编码器输入数据，在第二模式下核心编码器(300)用于接收由混合器(200)所产生的多个预混合声道，以作为核心编码器输入数据。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频编码/解码，特别是涉及空间音频编码以及空间音频对象编码。
技术介绍
空间音频编码工具是此
中所熟知的，例如，在环绕MPEG标准中已有标准化规范。空间音频编码从原始输入声道开始，例如在再现设定中依照其位置而识别的五个或七个声道，即左声道、中间声道、右声道、左环绕声道、右环绕声道以及低频增强声道。空间音频编码器通常从原始声道得到至少一个降混声道，以及另外得到关于空间线索的参数数据，例如声道相干数值的声道间水平差异、声道间相位差异、声道间时间差异等等。至少一个降混声道与指示空间线索的参数化辅助信息(parametricsideinformation，或称为参数边信息、参数侧信息或参数侧边信息)一起传送到空间音频解码器，空间音频解码器解码降混声道以及相关联的参数数据，最后取得为原始输入声道的近似版本的输出声道。声道在输出设定的放置通常为固定，例如，5.1声道格式或7.1声道格式等等。此外，空间音频对象编码工具是此
中所熟知的且在MPEGSAOC(SAOC＝spatialaudioobjectcoding空间音频对象编码)标准中已成标准。相比于空间音频编码从原始声道开始，空间音频对象编码从非自动专为特定渲染再现装备的音频对象开始。代替地，音频对象在再现场景中的位置可变化，且可由使用者通过将特定的渲染信息输入至空间音频对象编码解码器来确定。可选地或另外，渲染信息，即在再现装备中特定音频对象待放置的位置信...

【技术保护点】
一种音频编码器，用于编码音频输入数据(101)以获得音频输出数据(501)，所述音频编码器包含：输入接口(100)，用于接收多个音频声道、多个音频对象以及关于所述多个音频对象中的一个或多个音频对象的元数据；混合器(200)，用于混合所述多个对象以及所述多个声道以获得多个预混合声道，每一预混合声道包含声道的音频数据以及至少一个对象的音频数据；核心编码器(300)，用于核心编码核心编码器输入数据；以及元数据压缩器(400)，用于压缩关于所述多个音频对象中的所述一个或多个音频对象的所述元数据；其中所述音频编码器用于在一组至少两种模式的两种模式下操作，所述两种模式包含第一模式以及第二模式，在所述第一模式下所述核心编码器用于编码所述多个音频声道和所述多个音频对象，所述多个音频声道和所述多个音频对象由所述输入接口所接收以作为核心编码器输入数据，在所述第二模式下所述核心编码器(300)用于接收由所述混合器(200)所产生的所述多个预混合声道，以作为所述核心编码器输入数据。

【技术特征摘要】
【国外来华专利技术】2013.07.22 EP 13177378.01.一种音频编码器，用于编码音频输入数据(101)以获得音频输出数据(501)，所述
音频编码器包含：
输入接口(100)，用于接收多个音频声道、多个音频对象以及关于所述多个音频对象中
的一个或多个音频对象的元数据；
混合器(200)，用于混合所述多个对象以及所述多个声道以获得多个预混合声道，每一
预混合声道包含声道的音频数据以及至少一个对象的音频数据；
核心编码器(300)，用于核心编码核心编码器输入数据；以及
元数据压缩器(400)，用于压缩关于所述多个音频对象中的所述一个或多个音频对象的
所述元数据；
其中所述音频编码器用于在一组至少两种模式的两种模式下操作，所述两种模式包含第
一模式以及第二模式，在所述第一模式下所述核心编码器用于编码所述多个音频声道和所述
多个音频对象，所述多个音频声道和所述多个音频对象由所述输入接口所接收以作为核心编
码器输入数据，在所述第二模式下所述核心编码器(300)用于接收由所述混合器(200)所
产生的所述多个预混合声道，以作为所述核心编码器输入数据。
2.如权利要求1所述的音频编码器，进一步包含空间音频对象编码器(800)，用于从
空间音频对象编码器输入数据产生一个或多个传输声道以及参数化数据；其中所述音频编码
器额外以第三模式进行操作，在所述第三模式下所述核心编码器(300)编码从空间音频对
象编码器输入数据得到的所述一个或多个传输声道，所述空间音频对象编码器输入数据包含
所述多个音频对象，或另外地或可选择地，所述空间音频对象编码器输入数据包含所述多个
音频声道中的两个或更多个音频声道。
3.如权利要求1或2所述的音频编码器，进一步包含空间音频对象编码器(800)，用
于从空间音频对象编码器输入数据产生一个或多个传输声道以及参数化数据；其中所述音频
编码器额外以第四模式进行操作，在所述第四模式下所述核心编码器对由所述空间音频对象
编码器(800)从所述预混合声道所得到的传输声道进行编码，以作为所述空间音频对象编
码器输入数据。
4.如前述权利要求中任一项所述的音频编码器，进一步包含：
连接器，用于在所述第一模式下，连接所述输入接口(100)的输出至所述核心编码器
(300)的输入，以及用于在所述第二模式下，连接所述输入接口(100)的所述输出至所述

\t混合器(200)的输入以及连接所述混合器(200)的输出至所述核心编码器(300)的所述
输入；以及
模式控制器(600)，用于根据模式指示以控制所述连接器，所述模式指示从用户接口接
收到或从所述音频输入数据(101)所提取出。
5.如前述权利要求中任一项所述的音频编码器，进一步包含输出接口(500)，用于提
供输出信号以作为所述音频输出数据(501)，在所述第一模式下，所述输出信号包含所述核
心编码器(300)的输出以及压缩元数据，在所述第二模式下，所述输出信号包含所述核心
编码器(300)的输出且不具有任何元数据，在所述第三模式下，所述输出信号包含所述核
心编码器(300)的输出、SAOC辅助信息以及所述压缩元数据，以及在所述第四模式下，
所述输出信号包含所述核心编码器(300)的输出以及所述SAOC辅助信息。
6.如前述权利要求中任一项所述的音频编码器，其中所述混合器(200)用于使用所述
元数据和在回放设定下每一声道位置的指示来预渲染所述多个音频对象，所述多个声道与其
相关联，其中在所述回放设定中由所述元数据确定放置所述音频对象于所述至少两个音频声
道之间时，所述混合器(200)用于使用至少两个音频声道以及包含所述至少两个音频声道
的音频声道的所述总数目来混合音频对象。
7.如前述权利要求中任一项所述的音频编码器，进一步包含元数据解压缩器(420)，
用于解压缩由所述元数据压缩器(400)输出的压解元数据，以及其中所述混合器(200)根
据解压缩元数据以混合所述多个对象，其中所述元数据压缩器(400)执行的压缩操作为包
含量化步骤的有损压缩操作。
8.一种音频解码器，用于解码编码音频数据，所述音频解码器包含：
输入接口(1100)，用于接收所述编码音频数据，所述编码音频数据包含多个编码声道、
多个编码对象或关于所述多个对象的压缩元数据；
核心解码器(1300)，用于解码所述多个编码声道以及所述多个编码对象；
元数据解压缩器(1400)，用于解压缩所述压缩元数据；
对象处理器(1200)，用于使用所述解压缩元数据处理所述多个解码对象，以获得多个
输出声道(1205)，所述输出声道包含来自于所述对象以及所述解码声道的音频数据；以及
后置处理器(1700)，用于转换所述多个输出声道(1205)至输出格式；
其中当所述编码音频数据不包含任何音频对象时，所述音频解码器用于绕过所述对象处
理器并馈入多个解码声道至所述后置处理器(1700)，当所述编码音频数据包含编码声道以
及编码对象时，所述音频解码器馈入所述多个解码对象以及所述多个解码声道到所述对象处

\t理器(1200)。
9.如权利要求8所述的音频解码器，其中所述后置处理器(1700)用于转换所述多个
输出声道(1205)至立体表现或者再现格式，所述再现格式具有比输出声道的所述数目更少
的声道的数目，其中所述音频解码器用于根据从用户接口得到或者从所述编码音频信号提取
的控制输入控制所述后置处理器(1700)。
10.如权利要求8或9所述的音频解码器，其中所述对象处理器包含：
对象渲染器，用于使用解压缩元数据渲染解码对象；以及
混合器(1220)，用于混合渲染对象以及解码声道以获得所述多个输出声道(1205)。
11.如权利要求8至10中任一项所述的音频解码器，其中所述对象处理器(1200)包
含：空间音频对象编码解码器，用于解码一个或多个传输声道以及表示编码音频对象的相关
参数化辅助信息，其中所述空间音频对象编码解码器用于根据关于所述音频对象的放置的渲
染信息渲染所述解码音频对象，并控制所述对象处理器混合渲染的所述音频对象以及所述解
码音频声道以获得所述多个输出声道(1205)。
12.如权利要求8至10中任一项所述的音频解码器，其中所述对象处理器(1200)包
含空间音频对象编码解码器(1800)，用于解码一个或多个传输声道以及表示编码音频对象
及编码音频声道的相关参数化辅助信息，其中所述空间音频对象编码解码器用于使用所述一
个或多个传输声道以及所述参数化辅助信息解码所述编码音频对象以及所述编码音频声道，
且其中所述对象处理器用于使用所述解压缩元数据渲染所述多个音频...

【专利技术属性】
技术研发人员：亚历山大·阿达米，克里斯蒂安·鲍斯，萨沙·迪克，克里斯蒂安·厄特尔，西蒙·菲格，于尔根·赫勒，约翰内斯·希勒佩特，安德烈·赫尔策，迈克尔·卡拉舒曼，法比安·卡驰，阿西姆·孔茨，艾德里安·穆尔塔扎，简·普洛格施蒂斯，安德烈·希尔兹勒，汉内·斯滕泽尔，
申请(专利权)人：弗朗霍夫应用科学研究促进协会，
类型：发明
国别省市：德国;DE

全部详细技术资料下载我是这个专利的主人