音频解码器、音频编码器、方法和计算机可读存储介质技术

技术编号:13182951 阅读:81 留言:0更新日期:2016-05-11 14:42
用于基于已编码表示提供至少四个带宽扩展声道信号的音频解码器被配置为使用多声道解码,基于第一下变频混频信号及第二下变频混频信号的联合编码表示来提供第一下变频混频信号及第二下变频混频信号。该音频解码器被配置为使用多声道解码,基于该第一下变频混频信号提供至少第一音频声道信号及第二音频声道信号。该音频解码器被配置为使用多声道解码,基于该第二下变频混频信号来提供至少第三音频声道信号及第四音频声道信号。该音频解码器被配置为基于该第一音频声道信号及该第三音频声道信号执行多声道带宽扩展,以获得第一带宽扩展的声道信号及第三带宽扩展的声道信号。该音频解码器被配置为基于该第二音频声道信号及该第四音频声道信号执行多声道带宽扩展,以获得第二带宽扩展的声道信号及第四个带宽扩展的声道信号。音频编码器使用相关概念。

【技术实现步骤摘要】
【国外来华专利技术】音频解码器、音频编码器、方法和计算机可读存储介质
根据本专利技术的实施例创建用于基于已编码表示提供至少四个带宽扩展声道信号的音频解码器。根据本专利技术的另一实施例创建用于基于至少四个音频声道信号提供已编码表示的音频编码器。根据本专利技术的另一实施例创建用于基于已编码表示提供至少四个音频声道信号的方法。根据本专利技术的另一实施例创建用于基于至少四个音频声道信号提供已编码表示的方法。根据本专利技术的另一实施例创建用于执行所述方法之一的计算机程序。一般而言,根据本专利技术的实施例涉及n个声道的联合编码。
技术介绍
近年来,对音频内容的储存及发送的需求一直在稳定地增加。此外,对音频内容的储存及发送的质量要求也一直在稳定地增加。因此,用于音频内容的编码及解码的概念已得到增强。例如,已开发了所谓的“先进音频编码”(AAC),在例如国际标准ISO/IEC13818-7:2003中描述了该“先进音频编码”。此外,已创建一些空间延伸,例如所谓的“MPEG环绕声”,在例如国际标准ISO/IEC23003-1:2007中对其进行了描述。此外,在国际标准ISO/IEC23003-2:2010中描述了用于编码及解码音频信号的空间信息的额外改进,该国际标准涉及所谓的空间音频对象编码(SAOC)。此外,在国际标准ISO/IEC23003-3:2012中定义了灵活音频编码/解码概念,灵活音频编码/解码概念提供以良好的编码效率编码一般音频信号及语言信号两者且处理多声道音频信号的可能性,该国际标准描述所谓的“统一语音及音频编码”(USAC)概念。在MPEGUSAC[1]中,使用具有频带受限残余信号或全频带残余信号的复杂预测、MPS2-1-1或统一立体声来执行两个声道的联合立体声编码。MPEG环绕声[2]分层地组合OTT框及TTT框,以在发送残余信号或不发送残余信号的情况下进行多声道音频的联合编码。然而,希望提供用于三维音频场景的有效编码及解码的甚至更先进的概念。
技术实现思路
根据本专利技术的实施例创建一种用于基于已编码表示提供至少四个带宽扩展的声道信号的音频解码器。该音频编码器被配置为使用(第一)多声道解码,基于第一下变频混频信号及第二下变频混频信号的联合编码表示来提供第一下变频混频信号及第二下变频混频信号。该音频解码器被配置为使用(第二)多声道解码,基于第一下变频混频信号来提供至少第一音频声道信号及第二音频声道信号,且使用(第三)多声道解码,基于第二下变频混频信号来提供至少第三音频声道信号及第四音频声道信号。该音频解码器被配置为基于第一音频声道信号及第三音频声道信号执行多声道带宽扩展,以获得第一带宽扩展的声道信号及第三带宽扩展的声道信号。此外,该音频解码器被配置为基于第二音频声道信号及第四音频声道信号执行多声道带宽扩展,以获得第二带宽扩展的声道信号及第四带宽扩展的声道信号。根据本专利技术的该实施例基于如下发现:如果在多声道带宽扩展中使用在音频解码器的第二阶段中基于不同下变频混频信号获得的音频声道信号,则可在分层音频解码器中获得尤其良好的带宽扩展结果,其中,在音频解码器的第一阶段中从联合编码表示导出不同下变频混频信号。已发现,如果在分层音频解码器的第一阶段中分离与音频场景的知觉上尤其重要的位置相关联的下变频混频信号,同时在分层音频解码器的第二阶段中分离对于听觉印象并非如此重要的空间位置,则可获得尤其良好的音频质量。此外,已发现,应该在多声道带宽扩展中对与音频场景的在知觉上重要的不同位置(例如,音频场景的位置,其中来自这些位置的信号之间的关系在知觉上是重要的)相关联的音频声道信号进行联合处理,因为多声道带宽扩展可因此考虑来自这些听觉重要位置的信号的间的依从性及差异。这是通过基于第一音频声道信号(其在分层音频解码器的第二阶段中从第一下变频混频信号导出)且基于第三音频声道信号(其在分层音频解码器的第二阶段中从第二下变频混频信号导出)执行多声道带宽扩展,以获得两个带宽扩展的声道信号(亦即,第一带宽扩展的声道信号及第三带宽扩展的声道信号)来实现的。因此,(联合)多声道带宽扩展基于在分层多声道解码器的第二阶段中从不同下变频混频信号导出的音频声道信号来执行,使得第一音频声道信号与第三音频声道信号之间的关系类似于第一下变频混频信号与第二下变频混频信号之间的关系(或由其确定)。因而,多声道带宽扩展可使用此关系(例如,第一音频声道信号与第三音频声道信号之间的关系),该关系大体上通过使用多声道解码从第一下变频混频信号及第二下变频混频信号的联合编码表示导出第一下变频混频信号及第二下变频混频信号来确定,这在音频解码器的第一阶段中执行。因此,多声道带宽扩展可利用该关系,可在分层音频解码器的第一阶段中以良好的准确度来重现该关系,使得可实现尤其良好的听觉印象。在优选实施例中,第一下变频混频信号及第二下变频混频信号与音频场景的不同水平位置(或方位角位置)相关联。已发现,在不同水平音频位置(或方位角位置)之间进行区分尤其相关,因为人类听觉系统对于不同水平位置尤其敏感。因此,在分层音频解码器的第一阶段中在与音频场景的不同水平位置相关联的下变频混频信号之间进行分离是有利的,因为分层音频解码器的第一阶段中的处理通常比后续阶段中的处理更精确。此外,因此在(第一)多声道带宽扩展中联合使用的第一音频声道信号及第三音频声道信号与音频场景的不同水平位置相关联(因为在分层音频解码器的第二阶段中,从第一下变频混频信号导出第一音频声道信号,且从第二混频信号导出第三音频声道信号),从而允许(第一)多声道带宽扩展极其适于区分不同水平位置的人类能力。类似地,基于第二音频声道信号及第四音频声道信号执行的(第二)多声道带宽扩展对与音频场景的不同水平位置相关联的音频声道信号进行操作,使得(第二)多声道带宽扩展也可极其适于与音频场景的不同水平位置相关联的音频声道信号之间的在心理声学上重要的关系。因此,可实现尤其良好的听觉印象。在优选实施例中,第一下变频混频信号与音频场景的左侧相关联,且第二下变频混频信号与音频场景的右侧相关联。因此,第一音频声道信号通常也与音频场景的左侧相关联,且第三音频声道信号与音频场景的右侧相关联,使得(第一)多声道带宽扩展对来自音频场景的不同侧的音频声道信号进行操作(优选地联合操作),且可因此极其适于人类左/右知觉。这也适用于(第二)多声道带宽扩展,(第二)多声道带宽扩展基于第二音频声道信号及第四音频声道信号进行操作。在优选实施例中,第一音频声道信号及第二音频声道信号与音频场景的垂直相邻的位置相关联。类似地,第三音频声道信号及第四音频声道信号与音频场景的垂直相邻的位置相关联。已发现,在分层音频解码器的第二阶段中在与音频场景的垂直相邻的位置相关联的音频声道信号之间进行分离是有利的。此外,已发现,音频声道信号通常不会通过在与垂直相邻的位置相关联的音频声道信号之间进行分离而严重降级,使得多声道带宽扩展的输入信号仍极其适用于多声道带宽扩展(例如,立体声带宽扩展)。在优选实施例中,第一音频声道信号及第三音频声道信号与音频场景的第一公共水平面(本文档来自技高网
...

【技术保护点】
一种音频解码器(500;600;1300;1600;2000),用于基于已编码表示(510;610、682;1310、1312)来提供至少四个带宽扩展的声道信号(520、522、524、526),其中,所述音频解码器被配置为:使用多声道解码(530;630;1340),基于第一下变频混频信号及第二下变频混频信号的联合编码表示(510;610;1310)来提供所述第一下变频混频信号(532;632;1342)及所述第二下变频混频信号(534;634;1344);其中,所述音频解码器被配置为:使用多声道解码(540;640;1370),基于所述第一下变频混频信号来提供至少第一音频声道信号(542;642;1372)及第二音频声道信号(544;644;1374);其中,所述音频解码器被配置为:使用多声道解码(550;650;1380),基于所述第二下变频混频信号来提供至少第三音频声道信号(556;656;1382)及第四音频声道信号(558;658;1384);其中,所述音频解码器被配置为:基于所述第一音频声道信号及所述第三音频声道信号执行多声道带宽扩展(560;660;1390),以获得第一带宽扩展的声道信号(520;620;1320)及第三带宽扩展的声道信号(524;624;1324);以及其中,所述音频解码器被配置为:基于所述第二音频声道信号及所述第四音频声道信号执行多声道带宽扩展(570;670;1394),以获得第二带宽扩展的声道信号(522;622;1322)及第四带宽扩展的声道信号(526;626;1326)。...

【技术特征摘要】
【国外来华专利技术】2013.07.22 EP 13177376.4;2013.10.18 EP 13189306.71.一种音频解码器(500;600;1300;1600;2000),用于基于已编码表示(510;610、682;1310、1312)来提供至少四个带宽扩展的声道信号(520、522、524、526),
其中,所述音频解码器被配置为:使用多声道解码(530;630;1340),基于第一下变频混频信号及第二下变频混频信号的联合编码表示(510;610;1310)来提供所述第一下变频混频信号(532;632;1342)及所述第二下变频混频信号(534;634;1344);
其中,所述音频解码器被配置为:使用多声道解码(540;640;1370),基于所述第一下变频混频信号来提供至少第一音频声道信号(542;642;1372)及第二音频声道信号(544;644;1374);
其中,所述音频解码器被配置为:使用多声道解码(550;650;1380),基于所述第二下变频混频信号来提供至少第三音频声道信号(556;656;1382)及第四音频声道信号(558;658;1384);
其中,所述音频解码器被配置为:基于所述第一音频声道信号及所述第三音频声道信号执行第一联合多声道带宽扩展(560;660;1390),以获得第一带宽扩展的声道信号(520;620;1320)及第三带宽扩展的声道信号(524;624;1324),所述多声道带宽扩展使用所述第一音频声道信号与所述第三音频声道信号之间的关系;以及
其中,所述音频解码器被配置为:基于所述第二音频声道信号及所述第四音频声道信号执行第二联合多声道带宽扩展(570;670;1394),以获得第二带宽扩展的声道信号(522;622;1322)及第四带宽扩展的声道信号(526;626;1326)。


2.根据权利要求1所述的音频解码器,其中,所述第一下变频混频信号及所述第二下变频混频信号与音频场景的不同水平位置或方位角位置相关联。


3.根据权利要求1所述的音频解码器,其中,所述第一下变频混频信号与音频场景的左侧相关联,且所述第二下变频混频信号与所述音频场景的右侧相关联。


4.根据权利要求1所述的音频解码器,其中,所述第一音频声道信号及所述第二音频声道信号与音频场景的垂直相邻的位置相关联,以及
所述第三音频声道信号及所述第四音频声道信号与所述音频场景的垂直相邻的位置相关联。


5.根据权利要求1所述的音频解码器,其中,所述第一音频声道信号及所述第三音频声道信号与音频场景的第一公共水平面或第一公共高度相关联,但与所述音频场景的不同的水平位置或方位角位置相关联,
所述第二音频声道信号及所述第四音频声道信号与所述音频场景的第二公共水平面或第二公共高度相关联,但与所述音频场景的不同的水平位置或方位角位置相关联,
所述第一公共水平面或所述第一公共高度不同于所述第二公共水平面或所述第二公共高度。


6.根据权利要求5所述的音频解码器,其中,所述第一音频声道信号及所述第二音频声道信号与所述音频场景的第一公共垂直面或第一公共方位角位置相关联,但与所述音频场景的不同的垂直位置或高度相关联,以及
所述第三音频声道信号及所述第四音频声道信号与所述音频场景的第二公共垂直面或第二公共方位角位置相关联,但与所述音频场景的不同的垂直位置或高度相关联,
所述第一公共垂直面或第一方位角位置不同于所述第二公共垂直面或第二方位角位置。


7.根据权利要求1所述的音频解码器,其中,所述第一音频声道信号及所述第二音频声道信号与音频场景的左侧相关联,以及
所述第三音频声道信号及所述第四音频声道信号与所述音频场景的右侧相关联。


8.根据权利要求1所述的音频解码器,其中,所述第一音频声道信号及所述第三音频声道信号与音频场景的下部相关联,以及
所述第二音频声道信号及所述第四音频声道信号与所述音频场景的上部相关联。


9.根据权利要求1所述的音频解码器,其中,所述音频解码器被配置为:在使用所述多声道解码基于所述第一下变频混频信号及所述第二下变频混频信号的联合编码表示来提供所述第一下变频混频信号及所述第二下变频混频信号时执行水平划分。


10.根据权利要求1所述的音频解码器,其中,所述音频解码器被配置为:在使用所述多声道解码基于所述第一下变频混频信号来提供至少所述第一音频声道信号及所述第二音频声道信号时执行垂直划分;以及
所述音频解码器被配置为:在使用所述多声道解码基于所述第二下变频混频信号来提供至少所述第三音频声道信号及所述第四音频声道信号时执行垂直划分。


11.根据权利要求1所述的音频解码器,其中,所述音频解码器被配置为:基于所述第一音频声道信号及所述第三音频声道信号执行立体声带宽扩展,以获得所述第一带宽扩展的声道信号及所述第三带宽扩展的声道信号,
所述第一音频声道信号及所述第三音频声道信号表示第一左/右声道对;以及
所述音频解码器被配置为:基于所述第二音频声道信号及所述第四音频声道信号执行立体声带宽扩展,以获得所述第二带宽扩展的声道信号及所述第四带宽扩展的声道信号,
所述第二音频声道信号及所述第四音频声道信号表示第二左/右声道对。


12.根据权利要求1所述的音频解码器,
其中,所述音频解码器被配置为:使用基于预测的多声道解码,基于所述第一下变频混频信号及所述第二下变频混频信号的联合编码表示来提供所述第一下变频混频信号及所述第二下变频混频信号。


13.根据权利要求1所述的音频解码器,
其中,所述音频解码器被配置为:使用残余信号辅助的多声道解码,基于所述第一下变频混频信号及所述第二下变频混频信号的联合编码表示来提供所述第一下变频混频信号及所述第二下变频混频信号。


14.根据权利要求1所述的音频解码器,
其中,所述音频解码器被配置为使用基于参数的多声道解码,基于所述第一下变频混频信号来提供至少所述第一音频声道信号及所述第二音频声道信号;
其中,所述音频解码器被配置为使用基于参数的多声道解码,基于所述第二下变频混频信号来提供至少所述第三音频声道信号及所述第四音频声道信号。


15.根据权利要求14所述的音频解码器,其中,所述基于参数的多声道解码被配置为:估计对两个声道之间的所需相关性及/或两个声道之间的阶差进行描述的一个或多个参数,以基于相应下变频混频信号来提供所述两个音频声道信号或两个以上音频声道信号。


16.根据权利要求1所述的音频解码器,
其中,所述音频解码器被配置为:使用残余信号辅助的多声道解码,基于所述第一下变频混频信号来提供至少所述第一音频声道信号及所述第二音频声道信号;以及
其中,所述音频解码器被配置为:使用残余信号辅助的多声道解码,基于所述第二下变频混频信号来提供至少所述第三音频声道信号及所述第四音频声道信号。


17.根据权利要求1所述的音频解码器,
其中,所述音频解码器被配置为:使用多声道解码,基于第一残余信号及第二残余信号的联合编码表示来提供所述第一残余信号及所述第二残余信号,所述第一残余信号用于提供至少所述第一音频声道信号及所述第二音频声道信号,所述第二残余信号用于提供至少所述第三音频声道信号及所述第四音频声道信号。


18.根据权利要求17所述的音频解码器,其中,所述第一残余信号及所述第二残余信号与音频场景的不同的水平位置或方位角位置相关联。


19.根据权利要求17所述的音频解码器,其中,所述第一残余信号与音频场景的左侧相关联,且所述第二残余信号与所述音频场景的右侧相关联。


20.一种音频编码器(400;1500;2200),用于基于至少四个音频声道信号(410,412;1512,1514;2212、2222、2214、2224)来提供已编码表示(420;1532;2272、2282...

【专利技术属性】
技术研发人员:萨沙·迪克克里斯汀·厄泰尔克里斯汀·赫姆瑞希约翰内斯·希尔珀特安德烈斯·霍瑟亚琴·昆兹
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1