处理空间音频的方法,系统及制品技术方案

技术编号:16114608 阅读:46 留言:0更新日期:2017-08-30 07:57
本发明专利技术揭示用于处理经方向性编码音频以考虑收听者播放环境的空间特性的技术。所述经方向性编码音频数据包含指示音频场景中的声源的一或多个方向的空间信息。基于识别所述播放环境的所述空间特性的输入数据而修改所述音频数据。所述空间特性可对应于所述播放环境中的实际扩音器位置。还可处理所述经方向性编码音频以准许对音频场景中的声源或特定方向进行聚焦/散焦。所述所揭示技术可允许在播放时更准确地渲染所记录音频场景,而不管输出扩音器设置。另一优点在于:用户可动态地配置音频数据以使得其更好地符合所述用户的特定扩音器布局及/或所述用户对音频场景中的特定对象或区域的所要聚焦。

【技术实现步骤摘要】
【国外来华专利技术】处理空间音频的方法,系统及制品优先权主张本专利申请案主张2015年1月2日申请的临时申请案第62/099,395号及2015年7月23日申请的美国申请案第14/807,760号(两者标题均为“具有用户可配置的声聚焦的多声道声渲染(Multi-ChannelSoundReproductionWithUserConfigurableSoundFocus)”)的优先权,且特此以全文引用的方式明确地并入本文中,犹如完全在本文中阐明一般。
本专利技术大体来说涉及音频系统,且,更特定来说,涉及一种可动态地配置的多声道音频系统。
技术介绍
常规多声道记录通常在播放环境中假定固定扩音器位置;且因此,一些常规多声道音响系统基于标准扩音器配置处理并存储音频信号。标准多声道扩音器配置包含常规L-R立体声、5.1环绕立体声及7.1环绕立体声以及其它音响。然而,在用户的声学空间(例如,起居室、汽车或其类似者)中,扩音器位置与由标准指定的那些扩音器位置不匹配并不少见。此外,如果用户想要动态地配置扩音器设置或聚焦于声源或方向,那么应考虑实际设置及/或用户或装置选择以用于恰当的音频渲染。举例来说,如果一个扩音器出于例如电池不足问题或非标准位置的某种原因而为非理想的,那么音频播放系统应获得此信息并实时反映此些差异以用于恰当的音频渲染。存在用以使用经编码声源形成虚拟扩音器位置以补偿扩音器位置不匹配的一些已知方法,但这些方法可引起不可避免的声源位置不匹配,这是因为所述方法中的一些方法试图重新映射经处理的输出以形成虚拟扩音器。
技术实现思路
为了解决前述缺点,本文中所揭示的技术可处理经方向性编码音频以考虑收听者播放环境的实体特性,例如实际扩音器位置。本专利技术技术还可处理经方向性编码音频以准许对音频场景中来自特定方向的声音进行聚焦/散焦。所揭示技术的优点在于:可在播放时更准确地渲染所记录音频场景,而不管输出扩音器设置(即,扩音器的物理配置及布局)。另一优点在于:技术可准许用户动态地配置音频数据以使得其更好地符合用户的特定扩音器布局及/或用户的对音频场景中的特定对象或区域的所要聚焦。根据所揭示技术的方面,一种处理音频的方法包含:接收对应于场景的音频数据。所述音频数据包含指示所述场景中的一或多个声源的一或多个方向的空间信息。基于识别播放环境的一或多个空间特性的输入数据而修改所述音频数据。根据另一方面,一种系统包含经配置以接收对应于场景的音频数据的接口。所述音频数据包含指示场景中的一或多个声源的一或多个方向的空间信息。所述系统还包含处理器,所述处理器经配置以基于识别播放环境的一或多个空间特性的输入数据而修改所述音频数据。根据又一方面,一种系统包含用于接收对应于场景的音频数据的装置,其中所述音频数据包含指示场景中的一或多个声源的一或多个方向的空间信息;以及用于基于识别播放环境的一或多个空间特性的输入数据而修改音频数据的装置。根据又一方面,一种体现可由一或多个处理器执行的指令集的计算机可读媒体存储用于接收对应于场景的音频数据的程序代码,其中所述音频数据包含指示场景中的一或多个声源的一或多个方向的空间信息。所述计算机可读媒体还存储用于基于识别播放环境的一或多个空间特性的输入数据而修改音频数据的程序代码。前述概述并不界定对所附权利要求书的限制。在检查以下各图及详细描述后,所属领域的技术人员即将显而易见或将变得显而易见其它方面、特征及优点。意欲将所有此些额外特征、方面及优点包含于此描述内且受随附权利要求书保护。附图说明应理解,图式仅用于说明的目的且并不界定对所附权利要求书的限制。此外,诸图中的组件未必按比例绘制。在诸图中,相似参考数字贯穿不同视图指明对应零件。图1为说明实例音频输出空间的概念图,其中将音频掩蔽窗应用于经方向性编码音频数据以补偿不匹配的扩音器位置。图2为说明示范性掩蔽窗函数的曲线图。图3为说明经划分成26个扇段的另一实例音频输出空间的概念图。图4为说明实例音频输出空间的概念图,其中音频空间的区由用户启用且音频空间的其它区经禁用。图5为说明实例音频输出空间的概念图,其中音频空间的两个区由用户启用且音频空间的其它区经禁用。图6A到B为说明不同操作情境期间的实例多声道音频空间的概念图,其中各种音频场景区由用户选择性地启用或禁用。图7A到B为说明不同操作情境期间的实例立体声音频空间的概念图,其中各种音频场景区由用户选择性地启用或禁用。图8为说明手持式装置周围的实例音频场景空间的概念图,其中对应于手持式装置的后置摄像机的音频区经启用。图9为说明手持式装置周围的实例音频场景空间的概念图,其中对应于手持式装置的前置摄像机的音频区经启用。图10为根据本文中所揭示技术的用于对音频进行塑形的示范性系统的框图。图11为说明根据本文中所揭示技术的对音频进行塑形的方法的流程图。图12为可操作以执行多声道音频产生及方向性编码所接收音频的实例系统的图。图13为可操作以实施图12的系统的装置的实例的多个视图的图。图14A为相对于图12的系统的麦克风对的平面波传播的实例远场模型的图。图14B为可对应于图12的系统的麦克风的实例麦克风置放的图。图15为可包含于图12的系统中的麦克风的替代示范性布置的图。图16为说明用于校准播放系统的扩音器的实际位置以使得可根据本文中所描述的技术对音频数据进行塑形以考虑实际扬声器位置的技术的概念图。具体实施方式参看图式且并有图式的以下详细描述描述并说明音频处理技术的一或多个特定实例。充分详细地展示及描述并非为了限制而提供而仅用以举例说明及教示所揭示内容而提供的这些技术,以使得所属领域的技术人员能够实践所揭示技术。因此,在适于避免混淆技术的情况下,描述可省略所属领域的技术人员已知的某些信息。词“示范性”贯穿本申请案用于意指“用作实例、例子或说明”。本文中描述为“示范性”的任何系统、方法、装置、技术、特征或其类似者未必应被解释为较其它特征较佳或有利。本文中所揭示的音频处理技术的优点在于:可经由图形用户接口(GUI)自定义音频捕获以考虑任意或非标准扩音器布局。因此,可对基于标准声道捕获的数字音频数据进行“塑形”以考虑非标准扩音器配置。可如实渲染声音的空间印象而不管距所推荐标准位置的扩音器偏移。在本创新之前,对于自定义音频捕获及/或播放,并不存在此类灵活性及稳健性。已知的音频捕获及/或播放是针对固定标准扩音器位置,例如,环绕立体声5.1、环绕立体声7.1、立体声、单声道或其类似者。用户可能想要在播放时尽可能类似地渲染所记录音频场景,而不管其输出扩音器设置(即,扩音器的物理配置及布局)。所揭示音频处理技术准许用户动态地配置音频数据以使得其分别更好地符合用户的特定扩音器布局。另外,所揭示音频处理技术结合透明方向性音频场景渲染提供对来自特定方向的声音进行聚焦/散焦的能力。所揭示音频处理技术可在(例如)成对/基于矢量的振幅平移(panning)的上下文内提供所记录声源与所渲染源位置之间的透明匹配。因此,所揭示技术提供用户可调整的声音聚焦/散焦能力,同时维持对所渲染音频场景内的声音的方向性感知。所揭示技术还可在播放/渲染时动态地执行位置声音编码以使得音响系统可基于实际位置及可用扩音器的数目、基于关于此等扩音器的先验位置信息而达成互易性。本文中参考二维音频空间(场本文档来自技高网...
处理空间音频的方法,系统及制品

【技术保护点】
一种处理音频的方法,其包括:在装置处接收对应于场景的音频数据,其中所述音频数据包含指示所述场景中的一或多个声源的一或多个方向的空间信息;以及基于识别播放环境的一或多个空间特性的输入数据而修改所述音频数据。

【技术特征摘要】
【国外来华专利技术】2015.01.02 US 62/099,395;2015.07.23 US 14/807,7601.一种处理音频的方法,其包括:在装置处接收对应于场景的音频数据,其中所述音频数据包含指示所述场景中的一或多个声源的一或多个方向的空间信息;以及基于识别播放环境的一或多个空间特性的输入数据而修改所述音频数据。2.根据权利要求1所述的方法,其进一步包括:接收识别所述场景中的一或多个经启用区的选择;以及修改对应于所述一或多个经启用区的所述音频数据。3.根据权利要求2所述的方法,其中所述选择是基于所述装置的操作模式。4.根据权利要求2所述的方法,其中所述装置的所述操作模式是选自由经启用的前置摄像机及经启用的后置摄像机组成的群组。5.根据权利要求2所述的方法,其中所述装置包含摄像机且所述选择是基于所述摄像机的变焦操作。6.根据权利要求1所述的方法,其进一步包括:提供用户接口,所述用户接口经配置以准许用户选择所述场景中的一或多个经启用区;经由所述用户接口接收对所述场景中的至少一个经启用区的选择;以及修改对应于所述至少一个经启用区的所述音频数据。7.根据权利要求1所述的方法,其进一步包括:经由用户接口接收所述输入数据,所述用户接口准许所述用户根据所述播放环境的所述一或多个空间特性配置所述输入数据。8.根据权利要求1所述的方法,其中所述输入数据包含指示所述播放环境中的区的扇段定义。9.根据权利要求8所述的方法,其中所述扇段定义对应于所述播放环境中的扩音器位置。10.根据权利要求8所述的方法,其中修改所述音频数据包含:将掩蔽窗函数应用于所述音频数据,其中所述掩蔽窗函数对应于所述扇段定义。11.一种设备,其包括:接口,其经配置以接收对应于场景的音频数据,其中所述音频数据包含指示所述场景中的一或多个声源的一或多个方向的空间信息;以及处理器,其经配置以基于识别播放环境的一或多个空间特性的输入数据而修改所述音频数据。12.根据权利要求11所述的设备,其进一步包括经配置以接收识别所述场景中的一或多个经启用区的选择的第二接口;其中所述处理器经配置以修改对应于所述一或多个经启用区的所述音频数据。13.根据权利要求12所述的设备,其中所述选择是基于所述系统的操作模式。14.根据权利要求12所述的设备,其中所述系统包含摄像机且所述选择是基于所述摄像机的变焦操作。15.根据权利要求11所述的设备,其进一步包括用户接口,所述用户接口经配置以准许用户选择所述场景中的一或多个...

【专利技术属性】
技术研发人员:金莱轩拉格胡佛·沛瑞埃里克·维瑟
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1