分布式音频捕获和混合控制制造技术

技术编号:17785763 阅读:29 留言:0更新日期:2018-04-22 18:23
一种装置,包括:定位器,其被配置为确定至少一个媒体源的位置;用户界面,其被配置为生成与所述至少一个媒体源相关联的至少一个用户界面元素;所述用户界面还被配置为接收与所述用户界面元素相关联的至少一个用户界面输入;媒体源控制器,其被配置为基于所述至少一个用户界面输入来管理对与所确定的至少一个媒体源相关联的至少一个参数的控制;以及媒体源处理器,其被配置为基于所述媒体源位置估计来控制媒体源处理。

【技术实现步骤摘要】
【国外来华专利技术】分布式音频捕获和混合控制
本申请涉及用于分布式音频捕获和混合的装置和方法。本专利技术进一步涉及但不限于用于针对音频信号的空间处理的分布式音频捕获和混合以实现音频信号的空间再现的装置和方法。
技术介绍
当多个源在空间场中移动时,捕获来自这些源的音频信号并混合那些音频信号需要大量的手动工作。例如,将被呈现给听众并且产生有效的音频氛围的音频信号源的捕获和混合需要对装备和训练进行重大投资,音频信号源比如是在诸如剧院或演讲厅之类的音频环境内的扬声器或艺术家。通常实现的系统会是专业制作人员利用接近的麦克风例如用户佩戴的领夹式麦克风或者被附接到挑杆的麦克风来捕获靠近扬声器或其他源的音频信号,然后将该所捕获的音频信号与一个或多个合适的空间(或环境或音频场)音频信号手动混合,使得所产生的声音来自预期的方向。空间捕获装置或全向内容捕获(OCC)装置应该能够捕获高质量的音频信号,同时能够跟踪接近的麦克风。此外,这种系统的控制很复杂并且要求用户具有输入和输出配置的重要知识。例如,使用户能够在分布式捕获系统中可视化外部声源和外部捕获装置可能很困难。此外,当前的系统不能可视化它们是什么类型的外部捕获装置,如何选择不同的过滤参数,如何将外部捕获装置链接到实际的混音器音频通道,以及如何将不同的定位器标签关联到这些外部捕获装置和相关联的源。此外,在当前系统中存在的固有问题在于外部捕获装置音频信号与定位器标签相关联。这样的标签通常被设计了有效期或到期时间。然而,控制系统和用户界面控制目前不处理有效期或到期时间的到期。换句话说,目前还没有提出确定如何处理标签有效期控制的方法,也没有提出确定在标签有效期到期的情况下做什么或是确定如何处理在特定时段内无法产生信号的外部捕获装置音频流的方法。最后,当前系统捕获来自空间音频设备麦克风阵列和外部捕获装置麦克风的音频信号输入。当前系统没有提供一种简单的方法来使得用户能够区分音频通道,音频通道提供音频输入,该音频输入将在立体声渲染之前进行空间音频(SPAC)处理,并且只需要立体声渲染(外部源)。换句话说,目前没有定义能够实现SPAC麦克风配置或者实现针对用于多个设备的操作和支持的不同麦克风配置的支持。
技术实现思路
根据第一方面,提供了一种装置,包括:定位器,所述定位器被配置为确定至少一个媒体源的位置;用户界面,所述用户界面被配置为生成与所述至少一个媒体源相关联的至少一个用户界面元素;所述用户界面还被配置为接收与所述用户界面元素相关联的至少一个用户界面输入;媒体源控制器,所述媒体源控制器被配置为基于所述至少一个用户界面输入来管理与所确定的至少一个媒体源相关联的至少一个参数的控制;以及媒体源处理器,所述媒体源处理器被配置为基于所述媒体源位置估计来控制媒体源处理。所述定位器可以包括以下中的至少一个:基于无线电的定位的定位器,所述基于无线电的定位的定位器被配置为确定根据基于无线电的定位的媒体源位置估计;视觉定位器,所述视觉定位器被配置为确定基于视觉的媒体源位置估计;以及音频定位器,所述音频定位器被配置为确定基于音频的媒体源位置估计。所述用户界面可以被配置为生成标识位于基于所跟踪的媒体源位置估计的位置处的媒体源的视觉表示。所述用户界面可以被配置为生成源类型选择菜单以使输入能够标识所述至少一个媒体源类型,其中,标识位于基于所跟踪的媒体源位置估计的位置处的所述媒体源的所述视觉表示可以基于来自所述源类型选择菜单的选择项被确定。所述用户界面可以被配置为生成跟踪控制选择菜单;以及输入至少一个媒体源跟踪简档,其中所述媒体源控制器可以被配置为基于来自所述跟踪控制选择菜单的所述选择项来管理对媒体源位置估计的跟踪。所述用户界面可以被配置为生成使所述用户能够在所述视觉表示上为标签位置定义位置的标签位置视觉表示;并且其中,所述媒体源控制器可以被配置为基于由在所述视觉表示上为所述标签位置选择的位置所定义的位置偏移来管理对媒体源位置估计的跟踪。所述用户界面可以被配置为:生成包括多个音频通道的混音台视觉表示;和生成将来自所述混音台视觉表示的音频通道链接到与所述至少一个媒体源相关联的用户界面视觉表示的视觉表示。所述用户界面可以被配置为生成:生成至少一个仪表视觉表示;以及将所述至少一个仪表视觉表示与和所述至少一个媒体源相关联的所述视觉表示相关联。所述用户界面可以被配置为:以第一突出显示效果突出显示与关联到所述至少一个媒体源的所述至少一个用户界面视觉表示相关联的所述混音台视觉表示的任何音频通道;以及以第二突出显示效果突出显示与输出通道相关联的混音台视觉表示的任何音频通道。所述用户界面可以被配置为生成用户界面控件以实现渲染输出格式的定义,其中,媒体源处理器可以被配置为进一步基于所述渲染输出格式定义来基于跟踪的媒体源位置估计而控制媒体源处理。所述用户界面可以被配置为生成能够定义空间处理操作的用户界面控件,其中,所述媒体源处理器被配置为可以进一步基于所述空间处理定义来基于所跟踪的媒体源位置估计而控制媒体源处理。所述媒体源控制器可以进一步被配置为:监视与用于提供根据基于无线电的定位的媒体源位置估计的标签相关联的到期计时器;确定到期计时器的即将到期/到期;确定到期时间策略;以及将所述到期时间策略应用于对与所述标签相关联的所述媒体源位置估计的跟踪的管理。被配置为基于至少一个用户界面输入来管理对与所确定的至少一个媒体源相关联的至少一个参数的控制的媒体源控制器还可以被配置为:确定重新初始化标签策略;确定与标签相关联的到期时间的重新初始化;将所述重新初始化标签策略应用于对与所述标签相关联的所述媒体源位置估计的跟踪的管理。所述媒体源控制器可以被配置为实时地基于所述至少一个用户界面输入来管理与所确定的至少一个媒体源相关联的至少一个参数的控制。所述装置可以进一步包括被布置成几何形状的多个麦克风,使得所述装置被配置为从围绕所形成的几何形状的预定方向捕获声音。所述媒体源可以与被配置为从所述媒体源生成至少一个远程音频信号的至少一个远程麦克风相关联,其中,所述装置可以被配置为接收所述远程音频信号。所述媒体源可以与被配置为从所述媒体源生成远程音频信号的至少一个远程麦克风相关联,其中,所述装置可以被配置为将所述音频源位置发送到另一装置,所述另一装置被配置为接收所述远程音频信号。根据第二方面,提供了一种方法,包括:确定至少一个媒体源的位置;生成与所述至少一个媒体源相关联的至少一个用户界面元素;接收与所述用户界面元素相关联的至少一个用户界面输入;基于所述至少一个用户界面输入来管理与所确定的至少一个媒体源相关联的至少一个参数的控制;以及基于媒体源位置估计来控制媒体源处理。确定至少一个媒体源位置可以包括以下中的至少一个:确定根据基于无线电的定位的媒体源位置估计;确定基于视觉的媒体源位置估计;以及确定基于音频的媒体源位置估计。生成与所述至少一个媒体源相关联的至少一个用户界面元素可以包括:生成标识位于基于所跟踪的媒体源位置估计的位置处的媒体源的视觉表示。生成与所述至少一个媒体源相关联的至少一个用户界面元素可以包括生成使输入能够标识所述至少一个媒体源类型的源类型选择菜单,其中,生成标识位于基于所跟踪的媒体源位置估计的位置处的所述媒体源的所述视觉表示可以包括基于来自所述源类型选择菜单的选择本文档来自技高网
...
分布式音频捕获和混合控制

【技术保护点】
一种装置,包括:定位器,所述定位器被配置为确定至少一个媒体源的位置;用户界面,所述用户界面被配置为生成与所述至少一个媒体源相关联的至少一个用户界面元素;所述用户界面还被配置为接收与所述用户界面元素相关联的至少一个用户界面输入;媒体源控制器,所述媒体源控制器被配置为基于所述至少一个用户界面输入来管理与所确定的至少一个媒体源相关联的至少一个参数的控制;以及媒体源处理器,所述媒体源处理器被配置为基于所述媒体源位置估计来控制媒体源处理。

【技术特征摘要】
【国外来华专利技术】2015.07.08 GB 1511949.8;2015.07.27 GB 1513198.0;201.一种装置,包括:定位器,所述定位器被配置为确定至少一个媒体源的位置;用户界面,所述用户界面被配置为生成与所述至少一个媒体源相关联的至少一个用户界面元素;所述用户界面还被配置为接收与所述用户界面元素相关联的至少一个用户界面输入;媒体源控制器,所述媒体源控制器被配置为基于所述至少一个用户界面输入来管理与所确定的至少一个媒体源相关联的至少一个参数的控制;以及媒体源处理器,所述媒体源处理器被配置为基于所述媒体源位置估计来控制媒体源处理。2.根据权利要求1所述的装置,其中,所述定位器包括以下中的至少一个:基于无线电的定位的定位器,所述基于无线电的定位的定位器被配置为确定根据基于无线电的定位的媒体源位置估计;视觉定位器,所述视觉定位器被配置为确定基于视觉的媒体源位置估计;以及音频定位器,所述音频定位器被配置为确定基于音频的媒体源位置估计。3.根据权利要求1和2中任一项所述的装置,其中,所述用户界面被配置为生成视觉表示,所述视觉表示标识位于基于所跟踪的媒体源位置估计的位置处的所述媒体源。4.根据权利要求3所述的装置,其中,所述用户界面被配置为生成源类型选择菜单以使输入能够标识所述至少一个媒体源类型,其中,基于来自所述源类型选择菜单的选择项来确定标识位于基于所跟踪的媒体源位置估计的位置处的所述媒体源的所述视觉表示。5.根据权利要求1至4中任一项所述的装置,其中,所述用户界面被配置为生成跟踪控制选择菜单;以及输入至少一个媒体源跟踪简档,其中所述媒体源控制器被配置为基于来自所述跟踪控制选择菜单的选择项来管理对媒体源位置估计的跟踪。6.根据权利要求1至5中任一项所述的装置,其中,所述用户界面被配置为生成使所述用户能够在所述视觉表示上为标签位置定义位置的标签位置视觉表示;并且其中,所述媒体源控制器被配置为基于由在所述视觉表示上为所述标签位置选择的位置所定义的位置偏移来管理对媒体源位置估计的跟踪。7.根据权利要求1至6中任一项所述的装置,其中,所述用户界面被配置为生成以下中的至少一个:包括多个音频通道的混音台视觉表示,和将来自所述混音台视觉表示的音频通道链接到与所述至少一个媒体源相关联的用户界面视觉表示的视觉表示;以及至少一个仪表视觉表示,并且将所述至少一个仪表视觉表示关联到与所述至少一个媒体源相关联的所述视觉表示。8.根据权利要求7所述的装置,其中,所述用户界面被配置为:以第一突出显示效果突出显示与关联到所述至少一个媒体源的至少一个用户界面视觉表示相关联的所述混音台视觉表示的任何音频通道;以及以第二突出显示效果突出显示与输出通道相关联的所述混音台视觉表示的任何音频通道。9.根据权利要求1至8中任一项所述的装置,其中,所述用户界面被配置为生成以下中的至少一个:能够定义渲染输出格式的用户界面控件,其中,所述媒体源处理器被配置为进一步基于所述渲染输出格式定义来基于所跟踪的媒体源位置估计而控制媒体源处理;以及能够定义空间处理操作的用户界面控件,其中,所述媒体源处理器被配置为进一步基于所述空间处理定义来基于所跟踪的媒体源位置估计而控制媒体源处理。10.根据权利要求1至9中任一项所述的装置,其中,所述媒体源控制器还被配置为:监视与用于提供基于无线电的媒体源位置估计的标签相关联的到期计时器;确定所述到期计时器的即将到期/到期;确定到期时间策略;以及将所述到期时间策略应用于对与所述标签相关联的所述媒体源位置估计的跟踪的管理。11.根据权利要求10所述的装置,其中,所述媒体源控制器被配置为基于所述至少一个用户界面输入来管理对与所确定的至少一个媒体源相关联的至少一个参数的控制,所述媒体源控制器还被配置为:确定重新初始化标签策略;确定与标签相关联的到期时间的重新初始化;将所述重新初始化标签策略应用于对与所述标签相关联的所述媒体源位置估计的跟踪的管理。12.根据权利要求1至11中任一项所述的装置,其中,所述媒体源控制器被配置为实时地基于所述至少一个用户界面输入来管理与所确定的至少一个媒体源相关联的至少一个参数的控制。13.根据权利要求1至12中的任一项所述的装置,其中,所述媒体源与至少一个远程麦克风相关联,所述至少一个远程麦克风被配置为从所述媒体源生成至少一个远程音频信号,其中,所述装置被配置为以下中的至少一个:接收所述远程音频信号;以及将所述音频源位置发送到另...

【专利技术属性】
技术研发人员:A·勒蒂涅米A·埃罗南S·S·梅特
申请(专利权)人:诺基亚技术有限公司
类型:发明
国别省市:芬兰,FI

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1