用于编码和解码具有各种声道的多对象音频信号的设备和方法技术

技术编号:7953821 阅读:241 留言:0更新日期:2012-11-08 23:08
本发明专利技术提供了一种用于编码和解码多对象音频信号的设备和方法。该设备包括:缩混器,用于将音频信号缩混为一个缩混后的音频信号,并提取用于所述音频信号中的每一个的包括报头信息和空间线索信息的补充信息;编码器,用于对缩混后的音频信号进行编码;和补充信息编码器,用于生成该补充信息作为比特流。该报头信息包括用于所述音频信号中的每一个的标识信息和用于所述音频信号的声道信息。

【技术实现步骤摘要】

本专利技术涉及用于编码和解码多对象音频信号的设备和方法;并且,更具体地,涉及用于对具有各种声道的多对象音频信号进行编码和解码以及对形成有各种声道的多对象音频信号进行编码和解码的设备和方法。具有各种声道的多对象音频信号是包括其每ー个形成有不同声道(例如,单声道、立体声声道、和5. I声道)的多个音频对象的音频信号。该工作得到韩国信息通信部(MIC)和/或韩国信息技术(IT)研究院(IITA)的信息技术研究和开发规划的部分支持[2005-S-403-02, “super-intelligent multimediaanytime-anywhere realistic TV (bmaRTV) technology,.」。
技术介绍
根据现有技术的音频编码和解码技术使得用户能够被动收听音频内容。因此,已存在对于以下对由不同声道组成的多个音频对象进行编码和解码的设备和方法的需求,通过根据用户需求控制由不同声道组成的每一音频对象,使用各种方法合井一个音频上下文,而使得用户能够消费各种音频对象。作为现有技术,介绍了空间音频编码(SAC)。SAC是用于将多声道音频信号表达为缩混后的(down mixed)单声道信号或缩混后的立体声信号和空间线索、传送并恢复多声道音频信号的技木。基于SAC,可以以低比特率传送高质量多声道音频信号。然而,SAC不能编码和解码多声道多对象音频信号一例如包括其每ー个由诸如单声道、立体声、和5. I声道的不同声道组成的各种对象的音频信号,因为尽管音频信号由多个声道组成,但是SAC是用于编码和解码单对象音频信号的技木。作为另ー现有技术,介绍了双耳线索编码(BCC)。BCC可编码和解码多对象信号。然而,BCC不能编码和解码由除了单声道的各种声道组成的多对象音频信号,因为在BCC中音频对象限于形成有单声道的音频对象。如上所述,根据现有技术的音频信号编码和解码技术不能对由各种声道组成的多对象音频信号进行编码和解码,因为它们被设计为对由单声道组成的多对象信号或具有多声道的单对象音频信号进行编码和解码。所以,根据现有技术,用户必须根据音频信号编码和解码技术来被动收听音频上下文。所以,已存在对于以下对由各种声道组成的多个音频对象进行编码和解码的设备和方法的需求,通过根据用户需求控制其每ー个具有不同声道的每一音频对象,使用各种方法混合一个音频内容,以便消费各种音频对象。
技术实现思路
技术问题本专利技术的实施例g在提供ー种用于对 具有各种声道的多对象音频信号进行编码和解码以及对由各种声道组成的多对象音频信号进行编码和解码的设备和方法。本专利技术的其他目的和优点可通过以下描述而理解,并通过參考本专利技术的实施例而变得清楚。而且,对于本专利技术的领域的技术人员来说显而易见的是,可通过要求保护的部件及其组合来实现本专利技术的目的和优点。技术方案根据本专利技术的ー个方面,提供了ー种用于编码具有不同声道的多对象音频信号的设备,包括缩混单元,用于将音频信号缩混为一个缩混后的音频信号,并提取用于所述音频信号中的每ー个的包括报头信息和空间线索信息的补充信息;编码单元,用于对缩混后的音频信号进行编码;和补充信息编码单元,用于生成该补充信息作为比特流,其中该报头信息包括用于所述音频信号中的每ー个的标识信息;和用于所述音频信号的声道信息。根据本专利技术的另一方面,提供了ー种用于编码具有不同声道的多对象音频信号的方法,包括步骤将音频信号缩混为一个缩混后的音频信号,并提取用于所述音频信号中的每ー个的包括报头信息和空间线索信息的补充信息;对缩混后的音频信号进行编码;和生成该补充信息作为比特流,其中该报头信息包括用于所述音频信号中的每ー个的标识信息;和用于所述音频信号的声道信息。根据本专利技术的另一方面,提供了一种用于解码由不同声道组成的多对象音频信号的设备,包括输入信号分析単元,用于从输入的信号中恢复缩混后的音频信号,并从该输入的信号中包括的补充信息比特流中提取具有报头信息和空间线索信息的补充信息;音频对象提取单元,用于使用来自该输入信号分析单元的所提取的补充信息,来从所恢复的缩混后的音频信号中恢复每ー对象的音频信号;和输出单元,用于使用该输入的信号的控制信息,来输出所恢复的每ー对象的音频信号作为多对象音频信号,其中该报头信息包括用于所述音频信号中的每ー个的标识信息;和用于所述音频信号的声道信息。根据本专利技术的另一方面,提供了一种用于解码由不同声道组成的多对象音频信号的方法,包括步骤从输入的信号中恢复缩混后的音频信号,并从该输入的信号中包括的补充信息比特流中提取具有报头信息和空间线索信息的补充信息;使用所提取的补充信息,来从所恢复的缩混后的音频信号中恢复每ー对象的音频信号;和使用该输入的信号的控制信息,来输出所恢复的每ー对象的音频信号作为多对象音频信号,其中该报头信息包括用于所述音频信号中的每ー个的标识信息;和用于所述音频信号的声道信息。根据本专利技术的另一方面,提供了一种用于解码由不同声道组成的多对象音频信号的设备,包括输入信号分析単元,用于从输入的信号中恢复缩混后的音频信号,并从该输入的信号中包括的补充比特流中提取包括报头信息和空间线索信息的补充信息;补充信息控制单元,用于使用该输入的信号的控制信息,来控制所提取的补充信息;和输出单元,用于使用所控制的补充信息,来输出所恢复的缩混后的音频信号作为多对象音频信号,其中该报头信息包括用于所述音频信号中的每ー个的标识信息;和用于所述音频信号的声道信息。根据本专利技术的另一方面,提供了一种用于解码由不同声道组成的多对象音频信号的方法,包括步骤从输入的信号中恢复缩混后的音频信号,并从该输入的信号中包括的补充比特流中提取包括报头信息和空间线索信息的补充信息;使用该输入的信号的控制信息,来控制所提取的补充信息;和使用所控制的补充信息,来输出所恢复的缩混后的音频信号作为多对象音频信号,其中该报头信息包括用于所述音频信号中的每ー个的标识信息;和用于所述音频信号的声道信息。 有利效果根据本专利技术实施例的用于对具有各种声道的多对象音频信号进行编码和解码以及对由各种声道组成的多对象音频信号进行编码和解码的设备和方法通过有效编码和解码由不同声道组成的包括各种音频对象的音频内容,而使得用户能够根据其需求来主动消费音频内容。附图说明图I是图示了根据本专利技术示范实施例的用于编码多对象音频信号的设备的图。图2是描绘了图I中示出的单声道缩混器的图。图3是示出了图I的立体声声道缩混器的图。图4是图I的多声道缩混器的图。图5是图示了图I的第二缩混器的图。图6是示出了从图I的补充信息编码器生成的补充信息比特流的结构的图。图7是图示了图6中示出的补充信息比特流的结构的详细图。图8是图示了根据本专利技术另ー实施例的图6中示出的补充信息比特流的结构的详细图。图9是图示了根据本专利技术实施例的用于解码多对象音频信号的设备的框图。图10是图示了根据本专利技术另ー实施例的用于解码多对象音频信号的设备的框图。图11是根据本专利技术实施例的用于使用图I的设备来编码多对象音频信号的方法的流程图。图12是根据本专利技术实施例的用于使用图9的设备来解码多对象音频信号的方法的流程图。图13是根据本专利技术另一实施例的用于使用图10的设备来解码多对象音频信号的方法的流程图。具体实施例方式通过下面阐明的參考附图对本文档来自技高网
...

【技术保护点】
一种用于编码具有不同声道的多对象音频信号的设备,包括:缩混部件,用于将音频信号缩混为一个缩混后的音频信号,并提取用于所述音频信号中的每一个的包括报头信息和空间线索信息的补充信息;编码部件,用于对缩混后的音频信号进行编码;和补充信息编码部件,用于生成该补充信息作为比特流,其中该报头信息包括:用于所述音频信号中的每一个的标识信息;和用于所述音频信号的声道信息。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:白承权徐廷一李泰辰李用主张仁瑄刘载铉张大永洪镇佑金镇雄姜京玉
申请(专利权)人:韩国电子通信研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1