音频编码器、音频解码器、方法及计算机可读介质技术

技术编号:24097372 阅读:62 留言:0更新日期:2020-05-09 11:04
用于基于已编码表示来提供至少四个音频声道信号的音频解码器被配置为使用多声道解码,基于第一残余信号及第二残余信号的联合编码表示来提供该第一残余信号及该第二残余信号。该音频解码器被配置为使用残余信号辅助的多声道解码,基于第一下变频混频信号及该第一残余信号来提供第一音频声道信号及第二音频声道信号。该音频解码器被配置为使用残余信号辅助的多声道解码,基于第二下变频混频信号及该第二残余信号来提供第三音频声道信号及第四音频声道信号。音频编码器基于对应的考虑。

Audio encoder, audio decoder, method and computer readable medium

【技术实现步骤摘要】
音频编码器、音频解码器、方法及计算机可读介质本申请是国际申请日为2014年7月11日,优先权日为2013年7月22日的国际申请PCT/EP2014/064915进入中国国家阶段的对应的申请号为201480041694.1的中国专利技术专利申请“使用联合编码残余信号的音频解码器、音频编码器、方法和计算机可读介质”的分案申请。
根据本专利技术的实施例涉及用于基于已编码表示来提供至少四个音频声道信号的音频解码器。根据本专利技术的另一实施例涉及用于基于至少四个音频声道信号来提供已编码表示的音频编码器。根据本专利技术的另一实施例涉及用于基于已编码表示来提供至少四个音频声道信号的方法及用于基于至少四个音频声道信号来提供已编码表示的方法。根据本专利技术的另一实施例涉及用于执行所述方法之一的计算机程序。一般而言,根据本专利技术的实施例涉及n个声道的联合编码。
技术介绍
近年来,对音频内容的储存及发送的需求一直在稳定地增加。此外,对音频内容的储存及发送的质量要求也一直在稳定地增加。因此,用于音频内容的编码及解码的概念已得到增强。例如,已开发了所谓的“先进音频编码”(AAC),在例如国际标准ISO/IEC13818-7:2003中描述了该“先进音频编码”。此外,已创建一些空间延伸,例如所谓的“MPEG环绕声”,在例如国际标准ISO/IEC23003-1:2007中对其进行了描述。此外,在国际标准ISO/IEC23003-2:2010中描述了用于编码及解码音频信号的空间信息的额外改进,该国际标准涉及所谓的空间音频对象编码(SAOC)。此外,在国际标准ISO/IEC23003-3:2012中定义了灵活音频编码/解码概念,灵活音频编码/解码概念提供以良好的编码效率编码一般音频信号及语言信号两者且处理多声道音频信号的可能性,该国际标准描述所谓的“统一语音及音频编码”(USAC)概念。在MPEGUSAC[1]中,使用具有频带受限残余信号或全频带残余信号的复杂预测、MPS2-1-1或统一立体声来执行两个声道的联合立体声编码。MPEG环绕声[2]分层地组合OTT框及TTT框,以在发送残余信号或不发送残余信号的情况下进行多声道音频的联合编码。然而,希望提供用于三维音频场景的有效编码及解码的甚至更先进的概念。
技术实现思路
根据本专利技术的实施例创建一种用于基于已编码表示来提供至少四个音频声道信号的音频解码器。该音频解码器被配置为:使用多声道解码,基于第一残余信号及第二残余信号的联合编码表示来提供该第一残余信号及该第二残余信号。该音频解码器还被配置为:使用残余信号辅助的多声道解码,基于第一下变频混频信号及该第一残余信号来提供第一音频声道信号及第二音频声道信号。该音频解码器还被配置为:使用残余信号辅助的多声道解码,基于第二下变频混频信号及该第二残余信号来提供第三音频声道信号及第四音频声道信号。根据本专利技术的实施例基于发现可通过根据残余信号的联合编码表示导出两个残余信号来利用四个或甚至更多音频声道信号之间的依从性,该两个残余信号中每一个被用于使用残余信号辅助的多声道解码来提供两个或两个以上音频声道信号。换言之,已发现通常存在所述残余信号的一些相似性,使得可通过使用多声道解码从联合编码表示导出该两个残余信号来减少在解码至少四个音频声道信号时有助于改进音频质量的用于编码所述残余信号的比特率,这利用了所述残余信号之间的相似性及/或依从性。在优选实施例中,该音频解码器被配置为使用多声道解码,基于该第一下变频混频信号及该第二下变频混频信号的联合编码表示来提供该第一下变频混频信号及该第二下变频混频信号。因此,创建音频解码器的分层结构,其中使用分离的多声道解码导出在用于提供至少四个音频声道信号的残余信号辅助的多声道解码中使用的下变频混频信号及残余信号两者。此概念尤其有效,因为两个下变频混频信号通常包括可在多声道编码/解码中使用的相似性,且因为两个残余信号通常还包括可在多声道编码/解码中使用的相似性。因而,使用此概念通常可获得良好的编码效率。在优选实施例中,该音频解码器被配置为使用基于预测的多声道解码,基于该第一残余信号及该第二残余信号的该联合编码表示来提供该第一残余信号及该第二残余信号。基于预测的多声道解码的使用通常带来相当良好的残余信号重建质量。如果第一残余信号表示音频场景的左侧且第二残余信号表示音频场景的右侧,则此状况例如是有利的,因为人类听觉对于音频场景的左侧与右侧之间的差异通常相当敏感。在优选实施例中,该音频解码器被配置为使用残余信号辅助的多声道解码,基于该第一残余信号及该第二残余信号的联合编码表示来提供该第一残余信号及该第二残余信号。已发现,如果第一残余信号及第二残余信号是使用还接收残余信号(且通常还接收下变频混频信号,该下变频混频信号组合第一残余信号及第二残余信号)的多声道解码来提供的,则可实现第一残余信号及第二残余信号的尤其良好的质量。因而,存在解码阶段的级联,在该级联中,基于输入的下变频混频信号及输入的残余信号来提供两个残余信号(用于提供第一音频声道信号及第二音频声道信号的第一残余信号,及用于提供第三音频声道信号及第四音频声道信号的第二残余信号),其中该输入的残余信号还可指定为(该第一残余信号及该第二残余信号的)公共残余信号。因而,第一残余信号及第二残余信号事实上是“中间”残余信号,该“中间”残余信号是使用多声道解码从对应的下变频混频信号及对应的“公共”残余信号导出的。在优选实施例中,该基于预测的多声道解码被配置为估计预测参数,该预测参数描述使用先前帧的信号分量导出的信号分量对提供当前帧的残余信号(即,第一残余信号及第二残余信号)的贡献。该基于预测的多声道解码的使用带来残余信号(第一残余信号及第二残余信号)的尤其良好的质量。在优选实施例中,该基于预测的多声道解码被配置为基于(对应的)下变频混频信号及(对应的)“公共”残余信号获得该第一残余信号及该第二残余信号,其中该基于预测的多声道解码被配置为以第一符号应用公共残余信号,以获得该第一残余信号,且以第二符号应用公共残余信号,以获得该第二残余信号,该第二符号与该第一符号相反。已发现此基于预测的多声道解码带来重建该第一残余信号及该第二残余信号的良好效率。在优选实施例中,该音频解码器被配置为使用在修改型离散余弦变换域(MDCT域)中操作的多声道解码,基于该第一残余信号及该第二残余信号的联合编码表示来提供该第一残余信号及该第二残余信号。已发现可通过有效的方式来实现该概念,因为可用来提供该第一残余信号及该第二残余信号的联合编码表示的音频解码优选地在MDCT域中操作。因此,可通过在MDCT域中应用提供该第一残余信号及该第二残余信号的多声道解码来避免中间转换。在优选实施例中,该音频解码器被配置为使用USAC复杂立体声预测(例如,如以上引用的USAC标准中所提及的),基于该第一残余信号及该第二残余信号的联合编码表示来提供该第一残余信号及该第二残余信号。已发现此USAC复杂立体声预测带来该第一残余信号及该第二残余信号的良好解码结果。此本文档来自技高网
...

【技术保护点】
1.一种音频解码器(200;300;600;1300;1600;2000),用于基于已编码表示(210;310、360;610、682;1310、1312;1610)提供至少四个音频声道信号(220、222、224、226;320、322、324、326;620、622、624、626;1320、1322、1324、1326),/n其中,所述音频解码器被配置为使用多声道解码(230;330;680;1360),基于第一残余信号及第二残余信号的联合编码表示(210;310;682;1312)来提供所述第一残余信号(232;332;684;1362)及所述第二残余信号(234;334;686;1364);/n其中,所述音频解码器被配置为使用残余信号辅助的多声道解码(240;340;640;1370),基于第一下变频混频信号(212;312;632;1342)及所述第一残余信号来提供第一音频声道信号(220;320;642;1372)及第二音频声道信号(222;322;644;1374);以及/n其中,所述音频解码器被配置为使用残余信号辅助的多声道解码(250;350;650;1380),基于第二下变频混频信号(214;314;634;1344)及所述第二残余信号来提供第三音频声道信号(224;324;656;1382)及第四音频声道信号(226;326;658;1384)。/n...

【技术特征摘要】
20130722 EP 13177376.4;20131018 EP 13189305.91.一种音频解码器(200;300;600;1300;1600;2000),用于基于已编码表示(210;310、360;610、682;1310、1312;1610)提供至少四个音频声道信号(220、222、224、226;320、322、324、326;620、622、624、626;1320、1322、1324、1326),
其中,所述音频解码器被配置为使用多声道解码(230;330;680;1360),基于第一残余信号及第二残余信号的联合编码表示(210;310;682;1312)来提供所述第一残余信号(232;332;684;1362)及所述第二残余信号(234;334;686;1364);
其中,所述音频解码器被配置为使用残余信号辅助的多声道解码(240;340;640;1370),基于第一下变频混频信号(212;312;632;1342)及所述第一残余信号来提供第一音频声道信号(220;320;642;1372)及第二音频声道信号(222;322;644;1374);以及
其中,所述音频解码器被配置为使用残余信号辅助的多声道解码(250;350;650;1380),基于第二下变频混频信号(214;314;634;1344)及所述第二残余信号来提供第三音频声道信号(224;324;656;1382)及第四音频声道信号(226;326;658;1384)。


2.根据权利要求1所述的音频解码器,其中,所述音频解码器被配置为:使用多声道解码(370;630;1340),基于所述第一下变频混频信号及所述第二下变频混频信号的联合编码表示(360;610;1310)来提供所述第一下变频混频信号(212;312;632;1342)及所述第二下变频混频信号(214;314;634;1344)。


3.根据权利要求1或2所述的音频解码器,其中,所述音频解码器被配置为:使用基于预测的多声道解码,基于所述第一残余信号...

【专利技术属性】
技术研发人员:萨沙·迪克克里斯汀·厄泰尔克里斯汀·赫姆瑞希约翰内斯·希尔珀特安德烈斯·霍瑟亚琴·昆兹
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1