用于创建空间线索信息的代码转换设备制造技术

技术编号:8774642 阅读:196 留言:0更新日期:2013-06-08 18:23
提供了一种用于编码和解码具有各种声道的多对象音频信号的设备和方法,所述设备和方法提供了与传统的空间音频编码(SAC)比特流的后向兼容性。所述设备包括:音频对象编码单元,用于基于空间线索来编码输入到编码设备的音频对象信号,并创建用于编码后的音频对象信号的渲染信息,其中所述渲染信息提供了包括用于音频对象信号的空间线索信息、音频对象信号的声道信息和音频对象信号的标识信息的编码设备,并且所述编码设备使用在音频信号的编码和解码中。

【技术实现步骤摘要】

本专利技术涉及一种用于对具有各种声道的多对象音频信号进行编码和解码的设备和方法;且更具体地,涉及一种包括边信息(side information)比特流转换的用于对具有各种声道的多对象音频信号进行编码和解码的设备和方法,所述边信息比特流转换用于变换边信息比特流、并基于变换后的边信息比特流来恢复具有所期望的输出信号(即,各种声道)的多对象音频信号。具有各种声道的多对象音频信号表示用于针对每个音频对象具有不同声道(例如,单声道、立体声和5.1声道)的多对象的音频信号。这项工作受MIC/IITA 的 IT R&D 规划[2005-S-403-02,“Development ofSuper-1ntelligent Multimedia Anytime-anywhere Realistic TV SmarTV Technology(超智能多媒体任何时间任何地点逼真TV智能TV技术的开发)”]支持。
技术介绍
根据传统的音频编码/解码技术,用户应该被动地(inactively)聆听音频内容。这样,需要开发一种用于对在用于多个音频对象的多声道中的音频信号进行编码和解码的设备和方法,使得可以通过根据用户的需要而控制其每一个具有不同声道的音频对象并以各种方法而组合一个音频内容,来消费各种音频对象。传统的空间音频编码(SAC)是一种用于将多声道音频信号代表、传送、和恢复为缩混后的单声道或立体声信号的技术,并且它可以以低比特率来传送高质量的多声道音频信号。然而,由于传统的SAC能够对在仅用于一个音频对象的多声道中的信号进行编码和解码,所以它不能编码/解码多声道和多对象音频信号,例如,用于多声道(例如,单声道、立体声和5.1声道)中的各种对象的音频信号。此外,传统的心理声学编码(BCC:Binaural Cue Coding)技术可以编码/解码用于多对象的音频信号。然而,由于音频对象的声道限于单声道,所以不能对具有包括单声道的各种声道的多对象音频信号进行编码/解码。总之,由于传统的技术仅可以编码/解码具有单个声道的多对象音频信号、或者具有多声道的单对象音频信号,所以不能对具有各种声道的多对象音频信号进行编码/解码。因此,根据传统的音频编码/解码技术,用户应该被动地聆听音频内容。相应地,需要开发一种用于对在用于每个多音频对象的各种声道中的音频信号进行编码和解码的设备和方法,以通过控制根据用户的需要而不同的多声道中的每个音频对象、并根据各种方法而组合一个音频内容来消费各种音频对象。此外,需要一种用于将多对象音频比特流转换为传统的SAC比特流并且反之亦然的设备和方法,以提供在多对象音频编码器中创建的边信息比特流与传统的SAC编码器/解码器的边信息比特流之间的后向兼容性。如上所述,作为用于通过单独控制具有不同声道的多个音频对象并根据各种方法而组合一个音频内容来对各种声道的多对象音频信号进行编码和解码的设备和方法,需要开发一种可执行比特流转换的多声道和多对象音频编码和解码设备及方法,以提供与传统SAC比特流的后向兼容性,并控制具有多声道的每个多音频对象,从而以多样的方法来组合一个音频对象。
技术实现思路
技术问题本专利技术的实施例旨在提供一种用于对具有各种声道的多对象音频信号进行编码和解码、以提供与传统的空间音频编码(SAC)比特流的后向兼容性的设备和方法。技术解决方案根据本专利技术的一方面,提供了一种用于编码多对象音频信号的设备,包括:音频对象编码单元,用于基于空间线索(spatial cue)来编码输入到编码设备的音频对象信号,并创建用于编码后的音频对象信号的渲染信息,其中所述渲染信息包括用于音频对象信号的空间线索信息、音频对象信号的声道信息和音频对象信号的标识信息。根据本专利技术的又一方面,提供了一种用于创建渲染信息来解码多对象音频信号的代码转换设备,包括:第一矩阵单元,用于基于已编码音频对象信号的对象控制信息和播放信息来创建渲染信息,该渲染信息包括用于已编码音频对象信号的功率增益信息和输出位置信息;和渲染单元,用于基于第一矩阵单元所创建的渲染信息和用于从编码设备输入的已编码音频对象信号的渲染信息,来创建用于要从解码设备输出的音频信号的空间线索信肩、O根据本专利技术的又一方面,提供了一种用于创建多声道音频信号和用于解码多声道音频信号的渲染信息的代码转换设备,包括:解析单元,用于从用于由编码设备输入的已编码音频信号的渲染信息中分出用于已编码音频对象信号的渲染信息和用于多声道音频信号的渲染信息;第一矩阵单元,用于基于已编码音频对象信号的对象控制信息和播放信息来创建渲染信息,该渲染信息包括用于已编码音频对象信号的功率增益信息和输出位置信息;第二矩阵单元,用于基于由解析单元单独获取的用于已编码多声道音频信号的渲染信息,来创建包括用于多声道音频信号的每个声道的功率增益信息的渲染信息,和渲染单元,用于基于第一矩阵单元所创建的渲染信息、第二矩阵单元所创建的渲染信息、和由解析单元单独获取的用于已编码音频对象信号的渲染信息,来创建用于从解码设备输出的音频信号的空间线索信息。根据本专利技术的又一方面,提供了一种用于编码多对象音频信号的方法,包括如下步骤:基于空间线索来对所输入的音频对象信号进行编码,并创建用于编码后的音频对象信号的渲染信息,其中所述渲染信息包括用于音频对象信号的空间线索信息、音频对象信号的声道信息和音频对象信号的标识信息。根据本专利技术的又一方面,提供了一种用于创建渲染信息来解码多对象音频信号的代码转换方法,包括如下步骤:基于已编码音频对象信号的对象控制信息和播放信息来创建渲染信息,该渲染信息包括用于已编码音频对象信号的功率增益信息和输出位置信息;和基于在所述创建渲染信息的步骤中创建的渲染信息和用于在编码之后输入的已编码音频对象信号的渲染信息,来创建用于要在解码之后输出的音频信号的空间线索信息。根据本专利技术的又一方面,提供了一种用于创建渲染信息以解码多声道音频信号和多对象音频信号的代码转换方法,包括如下步骤:从用于在编码之后输入的已编码音频信号的渲染信息中分出用于已编码音频对象信号的渲染信息和用于多声道音频信号的渲染信息;基于用于已编码音频对象信号的对象控制信息和播放信息来创建渲染信息,该渲染信息包括用于已编码音频对象信号的功率增益信息和输出位置信息;基于在所述分出渲染信息的步骤中单独获取的用于已编码多声道音频信号的渲染信息,来创建包括用于多声道音频信号的每个声道的功率增益信息的渲染信息,和基于在所述创建包括功率增益信息和输出位置信息的渲染信息的步骤中创建的渲染信息、在所述创建包括用于多声道音频信号的每个声道的功率增益信息的渲染信息的步骤中创建的渲染信息、和在所述分出渲染信息的步骤中单独获取的用于已编码音频对象信号的渲染信息,来创建用于要在解码之后输出的音频信号的空间线索信息。根据本专利技术的又一方面,提供了一种用于创建空间线索信息的代码转换设备,该空间线索信息用于多声道音频解码器来解码多声道音频信号和多对象音频信号,该代码转换设备包括:渲染信息生成装置,用于创建用于所述多对象音频信号的第一渲染信息;和渲染装置,用于基于所述第一渲染信息和用于所述多对象音频信号的第二渲染信息,来创建用于所述多对象音频信号的空间线索信息,其中,所述第二渲染信息是从音本文档来自技高网
...

【技术保护点】
一种用于创建空间线索信息的代码转换设备,该空间线索信息用于多声道音频解码器来解码多声道音频信号和多对象音频信号,该代码转换设备包括:渲染信息生成装置,用于创建用于所述多对象音频信号的第一渲染信息;和渲染装置,用于基于所述第一渲染信息和用于所述多对象音频信号的第二渲染信息,来创建用于所述多对象音频信号的空间线索信息,其中,所述第二渲染信息是从音频编码器传送来的,并且包括用于所述多对象音频信号的预设信息。

【技术特征摘要】
2006.12.27 KR 10-2006-0135400;2007.01.12 KR 10-201.一种用于创建空间线索信息的代码转换设备,该空间线索信息用于多声道音频解码器来解码多声道音频信号和多对象音频信号,该代码转换设备包括: 渲染信息生成装置,用于创建用于所述多对象音频信号的第一渲染信息;和渲染装置,用于基于所述第...

【专利技术属性】
技术研发人员:白承权徐廷一李泰辰李用主张大永洪镇佑金镇雄姜京玉
申请(专利权)人:韩国电子通信研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1