音频信号译码器、提供上混信号表示型态的方法技术

技术编号:9519745 阅读:170 留言:0更新日期:2014-01-01 17:18
本发明专利技术提供了一种音频信号译码器、提供上混信号表示型态的方法。该音频信号译码器,用以根据下混信号表示型态及对象相关的参数信息而提供上混信号表示型态,该音频信号译码器包括:对象分离器,被配置为分解该下混信号表示型态,以根据该下混信号表示型态及使用该对象相关的参数信息中的至少一部分提供描述第一音频对象类型的一个或多个音频对象的第一集合的第一音频信息,及描述第二音频对象类型的一个或多个音频对象的第二集合的第二音频信息。该音频信号译码器还包括音频信号处理器,被配置为接收该第二音频信息,以及根据该对象相关的参数信息处理该第二音频信息,以获得该第二音频信息的已处理的版本。

【技术实现步骤摘要】
音频信号译码器、提供上混信号表示型态的方法本申请是分案申请,其母案申请的申请号为201080028673.8,申请日为2010年6月23日,专利技术名称为“音频信号译码器、对音频信号译码的方法、以及使用级联音频对象处理级的计算机程序”。
根据本专利技术的实施方式涉及用以根据下混信号表示型态及对象相关的参数信息而提供上混信号表示型态的一种音频信号译码器。根据本专利技术的其它实施方式涉及用以根据下混信号表示型态及对象相关的参数信息而提供上混信号表示型态的一种方法。根据本专利技术的其它实施方式涉及一种计算机程序。根据本专利技术的若干实施方式涉及一种进阶的卡拉OK/独唱SAOC系统。
技术介绍
在现代音频系统,期望以比特率有效方式传送与储存音频信息。此外,经常期望使用房间内空间分散的二扬声器或甚至更多扬声器来重制一音频内容。在此种情况下,期望探勘此种多扬声器配置的能力来允许使用者可在空间上识别不同音频内容或单一音频内容的不同项目。此项目的可通过将不同音频内容分开地分配至不同的扬声器而达成。换言之,在音频处理、音频传输及音频储存
,越来越期望处理多信道内容而改善听觉感受。使用多信道音频内容给使用者带来显著改善。举例言之,可获得三维空间的听觉感受,其带来娱乐用途上改善的使用者的满足。但多信道音频内容也可用于专业领域,例如用于电话会议用途,原因在于通过使用多信道音频回放,可改良扬声器的识别性。但也期望音频质量与比特率要求间有妥善折衷,以免因多信道应用造成过度资源负荷。最近,已经提出了用于含多个音频对象的音频场景的比特率有效传输及/或储存的参数技术,例如双声道提示编码(I型)(参见例如参考文献[BCC])、联合来源编码(参见例如参考文献[JSC])、及MPEG空间音频对象编码(SAOC)(参见例如参考文献[SAOC1]、[SAOC2])。这些技术是针对知觉上重构期望的输出音频场景而非通过波形匹配。图8示出此种系统(此处:MPEGSAOC)的系统综览。图8示出的MPEGSAOC系统800包括SAOC编码器810及SAOC译码器820。该SAOC编码器810接收多个对象信号x1至xN,其可表示为例如时域信号或时频域信号(例如,呈傅利叶转换的转换系数集合形式,或呈QMF次频带信号形式)。SAOC编码器810典型地也接收与对象信号x1至xN相关联的下混系数d1至dN。下混系数的分开集合可供下混信号的各信道利用。SAOC编码器810典型地被配置为通过根据相关联的下混系数d1至dN组合对象信号x1至xN而获得下混信号信道。典型地,具有比对象信号x1至xN更少的下混信道。为了允许(至少近似允许)在SAOC译码器820该端的对象信号的分开(或分开处理),SAOC编码器810提供一个或多个下混信号(标示为下混信道)812及旁信息814两者。旁信息814描述对象信号x1至xN的特性,以便允许译码器端的特定对象处理。SAOC译码器820被配置为接收一个或多个下混信号812及旁信息814两者。此外,SAOC译码器820典型地被配置为接收使用者互动信息及/或使用者控制信息822,其描述期望的描绘设定值。举例言之,使用者互动信息/使用者控制信息822可描述扬声器设定值及由对象信号x1至xN所提供的这些对象期望的空间位置。SAOC译码器820被配置为提供例如多个已译码的上混信道信号至这些上混信道信号可与多扬声器描绘配置的个别扬声器相关联。SAOC译码器820例如可包含对象分离器820a,其被配置为基于一个或多个下混信号812及旁信息814,至少近似重构对象信号x1至xN,借此获得重构的对象信号820b。但该重构的对象信号820b可能略为偏离原先对象信号x1至xN,例如,原因在于由于比特率限制而旁信息814可能并非相当足以用于完美重构。SAOC译码器820可进一步包括混合器820c,其可被配置为接收该重构的对象信号820b及使用者互动信息及/或使用者控制信息822,以及基于此而提供上混信道信号至混合器820c可经组配来使用该使用者互动信息及/或使用者控制信息822而判定个别重构的对象信号820b对上混信道信号至的贡献。使用者互动信息及/或使用者控制信息822例如可包含描绘信息(也标识为描绘系数),其判定个别重构的对象信号820b对上混信道信号至的贡献。但须注意于多个实施例中,对象的分开(通过图8的对象分离器820a指示)与混合(通过图8的混合器820c指示)在一个单一步骤中执行。为了达成此项目的,可运算总参数,其描述将一个或多个下混信号812直接映像至上混信道信号至这些参数可基于旁信息814及使用者互动信息及/或使用者控制信息822运算。现在参考图9a、9b及9c,将说明基于下混信号表示型态及对象相关的旁信息用以获得上混信号表示型态的不同装置。图9a示出包括SAOC译码器920的MPEGSAOC系统900的方块示意图。SAOC译码器920包括对象译码器922及混合器/描绘器926作为分开的功能区块。该对象译码器922根据下混信号表示型态(例如,呈以时域或时频域表示的一个或多个下混信号形式)及对象相关的旁信息(例如,呈对象母数据形式)而提供多个重构的对象信号924。混合器/描绘器926接收与多数N个对象相关联的重构的对象信号924,及基于此信号而提供一个或多个上混信道信号928。在SAOC译码器920中,对象信号924的提取与混合/描绘分开执行,其允许对象译码功能与混合/描绘功能分开,但带来相当高的运算复杂度。现在参考图9b,将简短讨论另一种MPEGSAOC系统930,其包括SAOC译码器950。SAOC译码器950根据下混信号表示型态(例如,呈一个或多个下混信号形式)及对象相关的旁信息(例如,呈对象母数据形式)而提供多个上混信道信号958。SAOC译码器950包括组合型对象译码器及混合器/描绘器,其被配置为在联合混合处理中获得上混信道信号958而未分开对象译码与混合/描绘,其中,这些用于联合上混处理的参数取决对象相关的旁信息及描绘信息两者。联合上混处理也取决于下混信息,其被视为该对象相关的旁信息的一部分。综上所述,上混信道信号958的提供可以一步式处理或两步式处理执行。现在参考图9c,将说明一种MPEGSAOC系统960。SAOC系统960包括SAOC至MPEG环绕转码器980而非SAOC译码器。SAOC至MPEG环绕转码器包括旁信息转码器982,其被配置为接收对象相关的旁信息(例如,呈对象母数据形式),以及可选地,一个或多个下混信号的信息及描绘信息。旁信息转码器也被配置为基于所接收的数据而提供MPEG环绕旁信息984(例如,呈MPEG环绕比特流形式)。如此,旁信息转码器982被配置为考虑描绘信息,以及可选地,有关一个或多个下混信号内容的信息,而将自该对象编码器所释出的对象相关的(参数)旁信息转换成信道相关的(参数)旁信息984。可选地,该SAOC至MPEG环绕转码器980可被配置为操纵例如由下混信号表示型态所描述的一个或多个下混信号而获得已经操纵的下混信号表示型态988。但可删除下混信号操纵器986,使得SAOC至MPEG环绕转码器980的输出下混信号表示型态988与SAOC至MPEG环绕转码器的输入下混信号表示型态相同。若基于SAOC至MP本文档来自技高网...
音频信号译码器、提供上混信号表示型态的方法

【技术保护点】
一种音频信号译码器(100;200;500;590),用以根据下混信号表示型态(112;210;510;510a)和对象相关的参数信息(110;212;512;512a)提供上混信号表示型态,所述音频信号译码器包括:对象分离器(130;260;520;520a),被配置为分解所述下混信号表示型态,以根据所述下混信号表示型态及使用所述对象相关的参数信息的至少一部分提供描述第一音频对象类型的一个或多个音频对象的第一集合的第一音频信息(132;262;562;562a),和描述第二音频对象类型的一个或多个音频对象的第二集合的第二音频信息(134;264;564;564a),音频信号处理器,被配置为接收所述第二音频信息(134;264;564;564a),以及根据所述对象相关的参数信息处理所述第二音频信息,以获得所述第二音频信息的已处理的版本(142;272;572;572a);以及音频信号组合器(150;280;580;580a),被配置为组合所述第一音频信息与所述第二音频信息的所述已处理的版本,以获得所述上混信号表示型态;其中,所述对象分离器被配置为根据XOBJ=MOBJEnergyl0r0...XEAO=AEAOMEAOEnergyl0r0获得所述第一音频信息及所述第二音频信息,其中,XOBJ表示所述第二音频信息的信道;其中,XEAO表示所述第一音频信息的对象信号;其中,MOBJEnergy=OLDLOLDL+Σi=0NEAO-1mi2OLDi00OLDROLDR+Σi=0NEAO-1ni2OLDiMEAOEnergy=m02OLD0OLDL+Σi=0NEAO-1mi2OLDin02OLD0OLDR+Σi=0NEAO-1Ni2OLDi......mNEAO-12OLDNEAO-1OLDL+Σi=0NEAO-1mi2OLDinNEAO-12OLDNEAO-1OLDR+Σi=0NEAO-1ni2OLDi其中,m0至为与所述第一音频对象类型的所述音频对象相关联的下混值;其中,n0至为与所述第一音频对象类型的所述音频对象相关联的下混值;其中,OLDi为与所述第一音频对象类型的所述音频对象相关联的对象位准差值;其中,OLDL及OLDR为与所述第二音频对象类型的所述音频对象相关联的共享对象位准差值;以及其中,AEAO为EAO预描绘矩阵。FDA0000378674260000023.tif,FDA0000378674260000024.tif...

【技术特征摘要】
2009.06.24 US 61/220,0421.一种音频信号译码器(100;200;500;590),用以根据下混信号表示型态(112;210;510;510a)和对象相关的参数信息(110;212;512;512a)提供上混信号表示型态,所述音频信号译码器包括:对象分离器(130;260;520;520a),被配置为分解所述下混信号表示型态,以根据所述下混信号表示型态及使用所述对象相关的参数信息的至少一部分提供描述第一音频对象类型的一个或多个音频对象的第一集合的第一音频信息(132;262;562;562a),和描述第二音频对象类型的一个或多个音频对象的第二集合的第二音频信息(134;264;564;564a),音频信号处理器,被配置为接收所述第二音频信息(134;264;564;564a),以及根据所述对象相关的参数信息处理所述第二音频信息,以获得所述第二音频信息的已处理的版本(142;272;572;572a);以及音频信号组合器(150;280;580;580a),被配置为组合所述第一音频信息与所述第二音频信息的所述已处理的版本,以获得所述上混信号表示型态;其中,所述对象分离器被配置为根据获得所述第一音频信息及所述第二音频信息,其中,XOBJ表示所述第二音频信息的信道;其中,XEAO表示所述第一音频信息的对象信号;其中,其中,m0至为与所述第一音频对象类型的所述音频对象相关联的下混值;其中,n0至为与所述第一音频对象类型的所述音频对象相关联的下混值;其中,OLDi为与所述第一音频对象类型的所述音频对象相关联的对象位准差值;其中,OLDL及OLDR为与所述第二音频对象类型的所述音频对象相关联的共享对象位准差值;以及其中,AEAO为EAO预描绘矩阵,其中,存在NEAO增强的音频对象信道,并且其中,l0和r0是下混信号。2.一种音频信号译码器(100;200;500;590),用以根据下混信号表示型态(112;210;510;510a)和对象相关的参数信息(110;212;512;512a)提供上混信号表示型态,所述音频信号译码器包括:对象分离器(130;260;520;520a),被配置为分解所述下混信号表示型态,以根据所述下混信号表示型态及使用所述对象相关的参数信息的至少一部分提供描述第一音频对象类型的一个或多个音频对象的第一集合的第一音频信息(132;262;562;562a),和描述第二音频对象类型的一个或多个音频对象的第二集合的第二音频信息(134;264;564;564a),音频信号处理器,被配置为接收所述第二音频信息(134;264;564;564a),以及根据所述对象相关的参数信息处理所述第二音频信息,以获得所述第二音频信息的已处理的版本(142;272;572;572a);以及音频信号组合器(150;280;580;580a),被配置为组合所述第一音频信息与所述第二音频信息的所述已处理的版本,以获得所述上混信号表示型态;其中,所述对象分离器被配置为根据获得所述第一音频信息及所述第二音频信息,其中,XOBJ表示所述第二音频信息的信道;其中,XEAO表示所述第一音频信息的对象信号;其中,

【专利技术属性】
技术研发人员:奥利弗·黑尔慕斯科尔内利娅·法尔克于尔根·赫莱约翰内斯·希尔珀特法尔科·里德鲁施列昂尼德·特伦蒂夫
申请(专利权)人:弗兰霍菲尔运输应用研究公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1