环绕声系统中扬声器位置的自动发现和定位技术方案

技术编号:21175467 阅读:26 留言:0更新日期:2019-05-22 11:51
描述了用于定位一组扬声器(106)和麦克风(108)的方法的实施例,其仅具有每个扬声器和麦克风之间的到达时间。自动发现过程(107)使用外部输入来设置:全局平移(3个连续参数)、全局旋转(3个连续参数)和离散对称,即任何轴对的交换和/或任何轴的反转。可以使用不同的到达时间获取技术,例如超声波扫描或通用多轨道音频内容。自动发现算法基于最小化某个成本函数,并且该过程允许记录中延迟,该延迟可能与发射中的延迟相关联。

Automatic Location and Location of Speakers in Surround Sound System

An embodiment of a method for locating a set of speakers (106) and microphones (108) is described, which has only the arrival time between each speaker and microphone. The automatic discovery process (107) uses external inputs to set up: global translation (3 continuous parameters), global rotation (3 continuous parameters) and discrete symmetry, i.e., the exchange of any pair of axes and/or the inversion of any axis. Different time-of-arrival acquisition techniques can be used, such as ultrasonic scanning or general multi-track audio content. The automatic discovery algorithm is based on minimizing a cost function, and the process allows for a delay in the record, which may be associated with a delay in the transmission.

【技术实现步骤摘要】
【国外来华专利技术】环绕声系统中扬声器位置的自动发现和定位
一个或多个实现总体涉及环绕声扬声器系统,并且更具体地涉及自动确定收听环境中的扬声器位置。版权声明本专利文件的公开内容的一部分包含受版权保护的材料。版权所有者不反对任何人对专利文件或专利公开内容进行传真复制,就如同它在专利和商标局专利文件或记录中出现的那样,但在其他方面保留所有版权。
技术介绍
环绕声扬声器系统包括数个扬声器以及低频效果(LFE)扬声器(低音炮),它们被设计为放置在房间中的指定位置以在水平平面中提供360度声音的音频环绕效果。在大多数情况下,环绕声系统将每个源声道映射到其自己的扬声器。许多不同的环绕声配置已经被开发出来,目前大多数环绕声应用的标准是5.1环绕声格式,其具有3个前置扬声器、2个后置扬声器和1个LFE声道。这常用于电影、电视和消费者应用,并且通常由传统多声道混音所需的规定位置驱动。对于环绕声系统定义了相对严格的扬声器放置规则,例如L和R声道之间60度,中置扬声器位于收听者正前方,环绕声道被放置为与中央声道成100-120度,任何额外的环绕扬声器均匀分布在60到150度之间。5.1环绕声系统通常受限于其传送180度或类似全景声音的能力,因此已经开发了更广泛的环绕声格式。例如,7.1声道环绕声常用于大型电影院,并增加了两个额外的声道以提供额外的左/右环绕声道或甚至额外的屏幕声道。其他环绕声配置包括9.1,10.2,11.1,22.2等等。在影院和家庭环境中,环绕声系统设置过程中的一个常见问题是房间内扬声器的位置。不同的房间大小和尺寸可能对扬声器定位造成约束,并且每个扬声器的定向角度以及它们的相对位置也是重要的。高级音频处理系统(例如AtmosTM)的出现已经引入了对于诸如5.1.2(5个环绕,1个LFE和2个高度扬声器),7.1.2,7.1.4,9.1.2等的配置使用包括高度扬声器的许多不同扬声器的可能性。随着能够在影院和家庭影院应用中支持多达24.1.10个声道,要被定位和定向的扬声器数量可能非常高。这给用户带来了显著的设置负担,并且可能导致扬声器的非最佳放置。为了增强新一代环绕声系统的可用性,需要如下这样一种方法,该方法允许用户容易地在多扬声器音频系统中放置扬声器,这样允许系统中扬声器的相对任意放置以及允许系统中扬声器的自动发现(自动搜寻)。
技术介绍
部分中讨论的主题不应仅仅因为在
技术介绍
部分中提及而被认为是现有技术。类似地,不应假设在
技术介绍
部分中提到的或与
技术介绍
部分的主题相关的问题先前已在现有技术中被认识到。
技术介绍
部分中的主题仅代表不同的方法,这些方法本身也可以是专利技术。DolbyAtmos,DolbyDigitalPlus,DolbyTrueHD和DolbyPulse是DolbyLaboratories(杜比实验室)的商标。出于本说明书的目的,以下术语具有相关联的含义:术语“声道”指的是音频信号加元数据,其中位置被编码为频道标识符,例如左前或右上环绕;“基于声道的音频”是如下这样的音频,该音频被格式化以用于通过预定义的扬声器区域集合进行重放,扬声器区域集合具有相关联的标称位置,例如5.1,7.1等等(即上文刚刚定义的声道集);术语“对象”指的是具有诸如视在源位置(例如,3D坐标)、视在源宽度等的参数源描述的一个或多个音频声道;“基于对象的音频”是指刚刚定义的对象集;“沉浸式音频”、“空间音频”或“自适应音频”指的是基于声道的和对象或基于对象的音频信号加上元数据,其使用在其中位置被编码为空间中的3D位置的音频流加元数据基于回放环境来呈现音频信号;“收听环境”指的是任何开放的,部分封闭的或完全封闭的区域,例如可用于音频内容单独回放或音频内容与视频或其他内容一起回放的房间,并且可以体现在家庭、影院、剧院、礼堂、工作室、游戏机等中。这样的区域可以在其中设置有一个或多个表面,例如可以直接反射或漫反射声波的墙壁或挡板。术语“驱动器”指的是单个电声换能器,其响应于电气音频输入信号而产生声音。术语“扬声器”或“扩音器”指的是整体外壳中的一个或多个驱动器,术语“机壳”或“外壳”指的是包围一个或多个驱动器的整体外壳。术语“扬声器馈送”可以指的是从音频呈现器发送到扬声器以便通过一个或多个驱动器进行声音回放的音频信号。
技术实现思路
描述了如下方法的实施例,该方法通过确定n个扬声器和m个麦克风中的每一个的到达时间(TOAs)并且获得房间中的扬声器的种子(初始)布局和被定义的配置参数来执行扬声器定位和自动发现。该方法评估多个候选TOA,作为提高过程鲁邦性的方法。这些数据项被输入到成本函数,通过使用TOA值来最小化该成本函数以求解扬声器和麦克风的位置以及每个扬声器的回放延迟(latency)和每个麦克风的记录延迟。该过程使用经最小化的成本函数输出以及配置参数和种子布局来生成扬声器和麦克风的估计位置、每个扬声器的估计延迟、以及结果质量的评估。然后,基于系统配置将输出的布局和延迟变换为规范格式(canonicalformat)。最小化算法的残差提供了原始TOA矩阵的内部相干性的估计,并且这用于生成误差估计,其允许系统迭代进行成本最小化过程以适当地改进估计。执行任何所需的后处理,例如优化呈现,基于特定应用(例如影院或家庭影院使用)提供关于扬声器/麦克风位置的用户警报和消息。实施例还包括用于通过如下操作在具有第一数量(n)的扬声器和第二数量(m)的麦克风的收听环境中定位扬声器的方法,该操作包括接收n个扬声器中的每个扬声器到m个麦克风中的每个麦克风的一个或多个相应到达时间(TOA),以产生多个TOA候选;接收收听环境的配置参数;使用每个扬声器的一个或多个相应TOA值中的每一个来最小化成本函数,以估计相应扬声器和麦克风的位置和延迟;在多个TOA候选中的每个TOA候选上迭代进行成本函数最小化;以及使用配置参数和经最小化的成本函数来向一个或多个后处理组件或音频呈现组件提供扬声器位置信息。换句话说,实施例包括用于在具有第一数量(n)的扬声器和第二数量(m)的麦克风的收听环境中定位扬声器的方法。该方法可以例如包括接收(或获得)n个扬声器中的每个扬声器到m个麦克风中的每个麦克风的相应到达时间(TOA),其中所接收(获得)的TOA包括至少一个扬声器到至少一个麦克风的多个TOA候选;接收(或获得)收听环境的配置参数;使用扬声器和麦克风中的每一个的相应TOA值中的每一个来最小化成本函数,以估计相应扬声器和麦克风的位置和延迟;在多个TOA候选中的每个TOA候选上迭代进行成本函数最小化;以及使用配置参数和经最小化的成本函数来向一个或多个后处理组件或音频呈现组件提供扬声器位置信息。所接收(获得)的TOA优选地可包括每一扬声器到每一麦克风的多个TOA候选。实施例还涉及执行或体现处理命令的系统和制品,该处理命令执行或实现上述方法操作。附图说明在以下附图中,类似的附图标记用于指示类似的元件。尽管以下附图示出了各种示例,但是一个或多个实施方式不限于附图中所示出的示例。图1示出了根据一些实施例的具有与具有自动发现组件的音频呈现器一起使用的数个扬声器的收听环境。图2示出了根据一些实施例的自动发现过程的主要功能组件。图3示出了根据一些实施例的用于在自动发现过程中执行成本函数最小化的系统。图4是示本文档来自技高网
...

【技术保护点】
1.一种用于在具有第一数量(n)的扬声器和第二数量(m)的麦克风的收听环境中定位扬声器的方法,包括:接收n个扬声器中的每个扬声器到m个麦克风中的每个麦克风的一个或多个相应的到达时间(TOA),以产生多个TOA候选;接收收听环境的配置参数;使用每个扬声器的一个或多个相应TOA值中的每一个来最小化成本函数,以估计相应扬声器和麦克风的位置和延迟;在多个TOA候选中的每个TOA候选上迭代进行成本函数最小化;以及使用配置参数和经最小化的成本函数来向一个或多个后处理组件或音频呈现组件提供扬声器位置信息。

【技术特征摘要】
【国外来华专利技术】2016.11.29 EP 16201136.5;2016.09.29 ES P201631264;1.一种用于在具有第一数量(n)的扬声器和第二数量(m)的麦克风的收听环境中定位扬声器的方法,包括:接收n个扬声器中的每个扬声器到m个麦克风中的每个麦克风的一个或多个相应的到达时间(TOA),以产生多个TOA候选;接收收听环境的配置参数;使用每个扬声器的一个或多个相应TOA值中的每一个来最小化成本函数,以估计相应扬声器和麦克风的位置和延迟;在多个TOA候选中的每个TOA候选上迭代进行成本函数最小化;以及使用配置参数和经最小化的成本函数来向一个或多个后处理组件或音频呈现组件提供扬声器位置信息。2.根据权利要求1所述的方法,其中,所接收的TOA包括至少一个扬声器到至少一个麦克风的多个TOA候选。3.根据权利要求1或2所述的方法,包括:基于由一个或多个扬声器回放的参考音频序列和从一个或多个麦克风获得的参考音频序列的记录来估计收听环境的脉冲(IR);并且使用IR来搜索直达声候选峰值,其中多个TOA候选对应于在搜索中识别的相应候选峰值,其中提供给一个或多个后处理组件或音频呈现组件的扬声器位置信息是基于对于其最小化步骤的残差低于某个阈值的TOA候选中的选择。4.根据权利要求1-3中任一项所述的方法,包括:通过以下之一来估计所述收听环境的脉冲响应(IR):将已知的参考音频序列与从麦克风获得的序列的记录互相关以导出伪脉冲响应,或对校准音频序列和从麦克风获得的校准音频序列的记录进行去卷积;使用IR通过评估参考峰值并使用参考峰值周围的噪声水平来搜索直达声候选峰值,其中多个TOA候选对应于在搜索中识别的相应候选峰值;以及通过选择初始TOA矩阵,利用最小化步骤的残差评估初始矩阵,以及改变TOA矩阵元素直到残差低于定义的阈值,来执行多峰值评估。5.根据权利要求4所述的方法,其中使用IR搜索直达声候选峰值包括:至少在IR的位于参考峰值之前的一部分中搜索替代峰值。6.根据权利要求1-5中任一项所述的方法,其中所述延迟包括至少一个扬声器的回放延迟。7.根据权利要求1-6中任一项所述的方法,其中所述延迟包括至少一个麦克风的记录延迟。8.根据权利要求1-7中任一项所述的方法,其中所述配置参数包括以下中的至少一个:数量n和m,所述收听环境的大小;回放和记录延迟的界限;二维或三维扬声器位置的规定;扬声器和麦克风相对定位的约束;扬声器和麦克风相对延迟的约束;和对于旋转、平移和轴反转对称消歧的参考。9.根据权利要求1-8中任一项所述的方法,还包括向所述成本函数提供种子布局,所述种子布局指定了在相对于定义的扬声器布局标准被定义的初始位置中扬声器和麦克风的正确数量的n和m。10.根据权利要求1-9中任一项所述的方法,还包括:基于所述收听环境中的扬声器的配置,将所估计的位置信息变换为规范格式。11.根据权利要求1-10中任一项所述的方法,其中,所述收听环境中的扬声器被置于环绕声配置中,所述环绕声配置...

【专利技术属性】
技术研发人员:D·阿提加G·圣高尔D·M·费舍尔A·玛蒂奥斯索尔D·斯凯尼A·J·希菲尔德
申请(专利权)人:杜比实验室特许公司杜比国际公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1