将输入声道配置的多个输入声道映射至输出声道配置的输出声道的方法、信号处理单元和计算机程序技术

技术编号:13229461 阅读:53 留言:0更新日期:2016-05-13 12:08
用于将输入声道配置的多个输入声道映射至输出声道配置的输出声道的方法,包括:提供与多个输入声道的每个输入声道相关联的规则的集合,其中规则定义相关联的输入声道与输出声道的集合之间的不同映射。对于多个输入声道的每个输入声道,访问与输入声道相关联的规则,确定访问的规则中定义的输出声道的集合是否存在于输出声道配置中,以及如果访问的规则中定义的输出声道的集合存在于输出声道配置中,选择访问的规则。根据选择的规则将输入声道映射至输出声道。

【技术实现步骤摘要】
【国外来华专利技术】将输入声道配置的多个输入声道映射至输出声道配置的输出声道的方法和信号处理单元
本专利技术涉及用于将输入声道配置的多个输入声道映射至输出声道配置的输出声道的方法及信号处理单元,特别地,涉及适用于不同扬声器声道配置之间的格式降混转换的方法及装置。
技术介绍
空间音频编码工具为业界众所周知且已经标准化,例如MPEG环绕标准。空间音频编码始于多个原始输入,例如5或7个输入声道,通过其在重现设置中的布置识别,例如识别为左声道、中声道、右声道、左环绕声道、右环绕声道、及低频加强(LFE)声道。空间音频编码器可从原始声道得到一个或多个降混声道,此外,可得到与空间线索相关的参数数据,如声道相干值中的声道间位准差、声道间相位差、声道间时间差等。一个或多个降混声道与指示空间线索的参数边带信息一起传送给空间音频解码器用于解码降混声道及相关联的参数数据,从而最终获得输出声道,其为原始输入声道的近似版本。声道在输出设置中的布置可以为固定,例如5.1格式、7.1格式等。此外,空间音频对象编码工具为业界众所周知且已经标准化,例如MPEGSAOC标准(SAOC=空间音频对象编码)。与始于原始声道的空间音频编码相反,空间音频对象编码始于非自动专用于某些渲染重现设置的音频对象。更确切地,音频对象在重现场景中的布置是灵活的且可由用户设置,例如通过将某些渲染信息输入空间音频对象编码解码器内。可选地或额外地,渲染信息可以作为额外的边带信息或元数据被传输;渲染信息可包括某个音频对象将被布置(例如经过一段时间)在重现设置中的哪个位置的信息。为了获得某个数据压缩,使用SAOC编码器对多个音频对象进行编码,通过根据某个降混信息对对象进行降混,SAOC编码器从输入对象计算一或多个传送声道。此外,SAOC编码器计算表示对象间线索的参数边带信息,如对象级差(OLD)、对象相干值等。如在SAC(SAC=空间音频编码)中,对于各个时间/频率拼贴块(tile)计算对象间参数数据。对于音频信号的某个帧(例如1024或2048个样本),考虑多个频带(例如24、32或64个频带),以便为每个帧及每个频带提供参数数据。例如,当音频片段有20帧且每个帧被划分为32个频带时,时间/频率拼贴块的数量为640。期望的重现格式,即输出声道配置(输出扬声器配置)可与输入声道配置不同,其中输出声道的数量与输入声道的数量不同。因此,可以要求格式转换以将输入声道配置的输入声道映射至输出声道配置的输出声道。
技术实现思路
本专利技术的目的在于提出一种以灵活的方式将输入声道配置的输入声道映射至输出声道配置的输出声道的被认可的办法。此目的由权利要求1的方法、权利要求25的计算机程序、权利要求26的信号处理单元及权利要求27的音频解码器实现。本专利技术的实施例提出一种用于将输入声道配置的多个输入声道映射至输出声道配置的输出声道的方法,该方法包括:提供与多个输入声道的每个输入声道相关联的规则集合,其中集合中的规则定义相关联的输入声道与输出声道集合之间的不同映射;对于多个输入声道的每个输入声道,访问与该输入声道相关联的规则,确定相关联的规则中定义的输出声道集合是否存在于输出声道配置中,以及如果访问的规则中定义的输出声道集合存在于输出声道配置中,选择该访问的规则;以及根据所选择的规则,将输入声道映射至输出声道。本专利技术的实施例提供一种计算机程序,当其在计算机或处理器上运行时,执行此种方法。本专利技术的实施例提供一种包括用于或被编程为执行此种方法的处理器的信号处理单元。本专利技术的实施例提供一种包括此种信号处理单元的音频解码器。本专利技术的实施例基于新颖的方法,其中描述潜在输入-输出声道映射的规则集合与多个输入声道中的每个输入声道相关联,并且其中对于给定输入-输出声道配置选择规则集合中的一个规则。由此,规则不与输入声道配置或与特定输入-声道配置相关联。因此,对于给定输入声道配置及特定输出声道配置,对于给定输入声道配置中存在的多个输入声道的每个,访问相关联的规则集合以便确定哪个规则匹配给定的输出声道配置。规则可直接定义待应用至输入声道的一个或多个系数,或可定义待应用的处理以得到待应用至输入声道的系数。根据系数,可生成系数矩阵如降混(DMX)矩阵,其可应用至给定输入声道配置的输入声道以将其映射至给定输出声道配置的输出声道。由于规则集合与输入声道相关联而非与输入声道配置或特定输入-输出声道配置相关联,因此本专利技术办法可以灵活的方式用于不同输入声道配置及不同输出声道配置。在本专利技术的实施例中,声道表示音频通道,其中各个输入声道及各个输出声道具有方向,其中相关联的扬声器相对于中心收听者位置定位。附图说明将关于附图描述本专利技术的实施例,其中:图1显示3D音频系统的3D音频编码器的概述;图2显示3D音频系统的3D音频解码器的概述;图3显示用于实现可在图2的3D音频解码器中实现的格式转换器的实施例;图4显示扬声器配置的示意俯视图;图5显示另一扬声器配置的示意后视图;图6a显示用于将输入声道配置的输入声道映射至输出声道配置的输出声道的信号处理单元的框图;图6b显示根据本专利技术实施例的信号处理单元;图7显示用于将输入声道配置的输入声道映射至输出声道配置的输出声道的方法;及图8更详细地显示映射步骤的示例。具体实施方式在详细描述本专利技术方法的实施例之前,给出其中可实现本专利技术方法的3D音频编解码系统的概述。图1和图2显示根据据实施例的3D音频系统的算法块。更具体地,图1显示3D音频编码器100的概述。音频编码器100在预渲染器/混合器电路102(可选择性地设置)处接收输入信号,更具体地,多个输入声道提供多个声道信号104、多个对象信号106及对应的对象元数据108给音频编码器100。通过预渲染器/混合器102处理的对象信号106(参考信号110)可被提供给SAOC编码器112(SAOC=空间音频对象编码)。SAOC编码器112生成提供给USAC编码器116(USAC=统一语音及音频编码)的输入。此外,信号SAOC-SI118(SAOC-SI=SAOC边带信息)也提供给USAC编码器116的输入。USAC编码器116进一步从预渲染器/混合器直接接收对象信号120以及声道信号及预渲染的对象信号122。对象元数据信息108被应用至OAM编码器124(OAM=对象元数据),OAM编码器124提供压缩的对象元数据信息126给USAC编码器。基于前述输入信号,USAC编码器116生成压缩输出信号MP4,如128所示。图2显示3D音频系统的3D音频解码器200的概述。音频解码器200,更具体地,USAC解码器202接收由图1的音频编码器100所产生的编码信号128(MP4)。USAC解码器202将接收到的信号128解码成声道信号204、预渲染的对象信号206、对象信号208、及SAOC传送声道信号210。进一步地,压缩的对象元数据信息212及信号SAOC-SI214通过USAC解码器输出。对象信号208被提供给对象渲染器216,对象渲染器216输出渲染的对象信号218。SAOC传送声道信号210被提供给SAOC解码器220,SAOC解码器220输出渲染的对象信号222。压缩的对象元数据信息212被提供给OAM解码器224用于输出各个控制信号给对象渲染器216以及提供给本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/62/CN105556991.html" title="将输入声道配置的多个输入声道映射至输出声道配置的输出声道的方法、信号处理单元和计算机程序原文来自X技术">将输入声道配置的多个输入声道映射至输出声道配置的输出声道的方法、信号处理单元和计算机程序</a>

【技术保护点】
一种用于将输入声道配置(404)的多个输入声道映射至输出声道配置(406)的输出声道的方法,所述方法包括:提供与所述多个输入声道的每个输入声道相关联的规则集合(400),其中所述规则定义相关联的所述输入声道与输出声道集合之间的不同映射;对于所述多个输入声道的每个输入声道,访问(500)与所述输入声道相关联的规则,确定(502)访问的所述规则中定义的所述输出声道集合是否存在于所述输出声道配置(406)中,以及如果访问的所述规则中定义的所述输出声道集合存在于所述输出声道配置(406)中,则选择(402,504)访问的所述规则;以及根据选择的所述规则,将所述输入声道映射(508)至所述输出声道。

【技术特征摘要】
【国外来华专利技术】2013.07.22 EP 13177360.8;2013.10.18 EP 13189249.91.一种用于将输入声道配置(404)的多个输入声道映射至输出声道配置(406)的输出声道的方法,所述方法包括:提供与所述多个输入声道的每个输入声道相关联的规则集合(400),其中所述规则定义相关联的所述输入声道与输出声道集合之间的不同映射;对于所述多个输入声道的每个输入声道,访问(500)与所述输入声道相关联的规则,确定(502)访问的所述规则中定义的所述输出声道集合是否存在于所述输出声道配置(406)中,以及如果访问的所述规则中定义的所述输出声道集合存在于所述输出声道配置(406)中,则选择(402,504)访问的所述规则;以及根据选择的所述规则,将所述输入声道映射(508)至所述输出声道,其中所述规则集合中的所述规则被按优先顺序排列,其中较高排序的规则比较低排序的规则更优先地被选择,并且包括以下至少一个:其中定义将所述输入声道映射至与水平收听者平面中的所述输入声道具有较低方向偏差的一个或多个输出声道的规则比定义将所述输入声道映射至与所述水平收听者平面中的所述输入声道具有较高方向偏差的一个或多个输出声道的规则被更高优先排序,其中定义将输入声道映射至具有与所述输入声道相同仰角的一个或多个输出声道的规则比定义将所述输入声道映射至具有与所述输入声道的仰角不同的仰角的一个或多个输出声道的规则被更高优先排序,其中在所述规则集合中,最高优先排序的规则定义具有相同方向的所述输入声道与输出声道之间的直接映射,以及其中与具有90度仰角的输入声道相关联的规则集合中的一个规则定义将所述输入声道映射至具有比所述输入声道的所述仰角更低的第一仰角的全部可用输出声道,并且所述规则集合中的另一较低优先排序的规则定义将所述输入声道映射至具有比所述第一仰角更低的第二仰角的全部可用输出声道。2.如权利要求1所述的方法,包括:如果访问的所述规则中定义的所述输出声道集合不存在于所述输出声道配置(406)中,则不选择访问的所述规则,并且重复访问、确定及选择与所述输入声道相关联的至少一个其它规则的步骤。3.如权利要求1所述的方法,其中所述规则定义待应用至所述输入声道的增益系数、待应用至所述输入声道的延迟系数、待应用以将输入声道映射至两个或更多个输出声道的平移法则、以及待应用至所述输入声道的频率相关增益中的至少一个。4.如权利要求1所述的方法,包括:以特定顺序访问所述规则集合中的所述规则直到确定访问的所述规则中定义的所述输出声道集合存在于所述输出声道配置(406)中,以便通过所述特定顺序给定所述规则的优先次序。5.如权利要求1所述的方法,其中假定传递较高声音质量的规则比假定传递较低声音质量的规则被更高优先排序。6.如权利要求1所述的方法,其中,在所述规则集合中,最高优先排序的规则定义具有相同方向的所述输入通道与输出通道之间的直接映射,所述方法包括:对于每个输入声道,在访问存储与每个输入声道相关联的规则集合中的其它规则的存储器(422)之前,检查具有与所述输入声道相同方向的输出声道是否存在于所述输出声道配置(406)中。7.如权利要求1所述的方法,其中,在所述规则集合中,最低优先排序的规则定义将所述输入声道映射至具有左输出声道及右输出声道的立体声输出声道配置的一个或两个输出声道。8.如权利要求1所述的方...

【专利技术属性】
技术研发人员:于尔根·赫勒法比安·卡驰迈克尔·卡拉舒曼阿西姆·孔茨克里斯托弗·佛里尔
申请(专利权)人:弗朗霍夫应用科学研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1