声源方向的确定制造技术

技术编号:28424936 阅读:39 留言:0更新日期:2021-05-11 18:33
公开了用于确定声源方向的装置和方法。该装置包括至少一个处理器和包括计算机程序代码的至少一个存储器,该至少一个存储器和计算机程序代码被配置为与至少一个处理器一起使得该装置至少:接收元数据,其中,所述元数据包括提供直接声音与其它声音之间的平衡的指示的直接声音信息;基于所接收的元数据,确定与多个方向相关联的多个度量,其中,所述度量取决于所述直接声音的量;以及针对相应的多个方向,累积取决于所述多个度量的值,以使得能够确定声源方向。

【技术实现步骤摘要】
声源方向的确定
本公开的实施例涉及使得能够确定声源方向。
技术介绍
期望确定一个或多个声源的方向。当前的技术可以例如执行数字信号处理,以将已知物理偏移的在麦克风处捕获的相关音频事件之间的延迟转换成音频事件的声源的位置。
技术实现思路
根据各种但并非全部的实施例,提供了一种装置,该装置包括:用于提供与多个方向相关联的多个度量的部件,其中,该度量针对相应的多个方向取决于所传播的直接声音的量;以及用于针对相应的多个方向,累积取决于与相应的多个方向相关联的度量的值,以使得能够确定声源方向的部件。在一些但并非全部的示例中,在同一时间段针对多个频率分别确定度量,其中,针对相应的多个方向,累积取决于与相应的多个方向相关联的度量的值,以使得能够确定声源方向包括:针对相应的多个方向,跨多个时间段和多个频率来累积取决于与相应的多个方向相关联的度量的值,以使得能够确定声源方向。在一些但并非全部的示例中,针对相应的多个方向,跨多个时间段和多个频率来累积取决于与相应的多个方向相关联的度量的值使用频率相关的加权,在该累积中,该加权对针对第一频率的取决于度量的值的加权多于对针对第二不同频率的取决于度量的值的加权。在一些但并非全部的示例中,该装置包括:用于接收元数据的部件,其中,元数据包括针对相应的多个方向提供直接声音和其它声音之间的平衡的指示的直接声音信息;以及用于使用元数据来确定多个度量的部件。在一些但并非全部的示例中,元数据包括取决于直接声音的能量与其它声音的能量之比的值。在一些但并非全部的示例中,该装置包括用于接收元数据的部件,其中,元数据包括:第一元数据,其用于所述累积,并定义相应的多个方向;以及第二元数据,其用于确定度量,并且针对相应的多个方向,取决于相对于混响声音或环境声音量的所传播的直接声音的量。在一些但并非全部的示例中,元数据包括针对多个时间段的在同一时间段针对多个频率的元数据。在一些但并非全部的示例中,针对相应的多个方向,累积取决于与相应的多个方向相关联的度量的值以使得能够确定声源方向使用由核函数定义的直接音频模型,该核函数控制度量如何在角分布上被累积。在一些但并非全部的示例中,度量是直接能量度量,该直接能量度量指示针对相应的多个方向的所传播的直接声音的能量。在一些但并非全部的示例中,直接能量度量是或者基于所传播的直接声音的能量与所传播的总声音能量之比。在一些但并非全部的示例中,直接能量度量是基于所传播的总声音能量,该总声音能量根据所接收的音频信号来确定或者根据所接收的元数据来确定。在一些但并非全部的示例中,直接能量度量是基于将非定向能量值或总能量值映射到表示直接传播的声音能量的直接能量值。在一些但并非全部的示例中,通过在映射之前将非线性函数应用于非定向能量值或总能量值以提供直接能量度量,或者通过在映射之后将非线性函数应用于直接能量值以提供直接能量度量,来确定直接能量度量。在一些但并非全部的示例中,该映射包括:使用所传播的直接声音的能量与所传播的总声音能量之比来对总能量值进行加权;或者使用所传播的直接声音的能量与所传播的非直接声音的能量之比来对非直接能量值进行加权。在一些但并非全部的示例中,该映射是频率相关的。在一些但并非全部的示例中,该装置包括:用于基于针对相应的多个方向来累积取决于与相应的多个方向相关联的度量的值来确定声源方向的部件。在一些但并非全部的示例中,该装置被配置为处理由该装置记录的音频信号以提供与多个方向相关联的多个度量。在一些但并非全部的示例中,该装置包括用于处理一个或多个所接收的音频信号以提供与多个方向相关联的多个度量的部件,或者包括用于接收与多个方向相关联的多个度量的部件。在一些但并非全部的示例中,该装置被配置为渲染音频。在一些但并非全部的示例中,该装置被配置为捕获音频。根据各种但并非全部的实施例,提供了一种方法,该方法包括:提供与多个方向相关联的多个度量,其中,该度量针对相应的多个方向取决于所传播的直接声音的量;以及针对相应的多个方向,累积取决于与相应的多个方向相关联的度量的值,以使得能够确定声源方向。根据各种但并非全部的实施例,提供了一种计算机程序,该计算机程序在计算机上运行时执行以下操作:提供与多个方向相关联的多个度量,其中,该度量针对相应的多个方向取决于所传播的直接声音的量;以及针对相应的多个方向,累积取决于与相应的多个方向相关联的度量的值,以使得能够确定声源方向。根据各种但并非全部的实施例,提供了如在所附的权利要求中所要求保护的示例。附图说明现在将参考附图来描述一些示例实施例,其中:图1示出了在本文中描述的主题的示例实施例;图2A示出了在本文中描述的主题的另一示例实施例;图2B示出了在本文中描述的主题的另一示例实施例;图3示出了在本文中描述的主题的另一示例实施例;图4示出了在本文中描述的主题的另一示例实施例;图5示出了在本文中描述的主题的另一示例实施例;图6示出了在本文中描述的主题的另一示例实施例;图7示出了在本文中描述的主题的另一示例实施例;图8示出了在本文中描述的主题的另一示例实施例;图9示出了在本文中描述的主题的另一示例实施例。具体实施方式图1示出了装置100的示例,该装置100包括:用于提供多个度量10的部件110和用于累积取决于度量10的值以使得能够确定声源方向的部件120。图2A图示了从多个方向Dn传播的直接声音量Sn。在该示例中,方向Dn是相对于原点O的,并且使用箭头来示意。方向Dn是示例,可以使用其他方向Dn。方向Dn上的箭头的粗细指示在该方向Dn上朝着原点O传播的直接声音量Sn。方向Dn可以使用三维关系(θ,φ)来定义,其中θ,φ是正交角度,诸如仰角φ(其可以被表示为极角90°-φ)和方位角θ。图2B图示了所确定的声源方向SSD。返回参考图1,装置100包括:用于提供与多个方向Dn相关联的多个度量10的部件110,其中,度量10针对相应的多个方向Dn取决于所传播的直接声音量Sn;以及用于针对相应的多个方向Dn,累积取决于与相应的多个方向Dn相关联的度量10的值以使得能够确定声源方向SSD的部件120。直接声音是从源直接被传播到原点O的声音。它与被一个或多个表面反射的间接声音(混响声音)和可由若干互不相干的声源产生的环境声音有所区别。一个或多个声源的方向根据累积值20来被导出。在一些示例中,声源方向SSD的确定可以在装置100处发生。然而,在其他示例中,装置100可以输出累积值20,以使得声源方向SSD的确定可在其他位置发生。声源方向SSD可被确定为在某个时刻指向多个声源的方向或者在不同时刻指向一个(或多个)声源的方向。可以使用低比特率流来执行累积本文档来自技高网...

【技术保护点】
1.一种装置,包括:/n至少一个处理器;以及/n包括计算机程序代码的至少一个存储器,所述至少一个存储器和所述计算机程序代码被配置为与所述至少一个处理器一起使得所述装置至少:/n接收元数据,其中,所述元数据包括提供直接声音与其它声音之间的平衡的指示的直接声音信息;/n基于所接收的元数据,确定与多个方向相关联的多个度量,其中,所述度量取决于所述直接声音的量;以及/n针对相应的多个方向,累积取决于所述多个度量的值,以使得能够确定声源方向。/n

【技术特征摘要】
20191108 GB 1916256.91.一种装置,包括:
至少一个处理器;以及
包括计算机程序代码的至少一个存储器,所述至少一个存储器和所述计算机程序代码被配置为与所述至少一个处理器一起使得所述装置至少:
接收元数据,其中,所述元数据包括提供直接声音与其它声音之间的平衡的指示的直接声音信息;
基于所接收的元数据,确定与多个方向相关联的多个度量,其中,所述度量取决于所述直接声音的量;以及
针对相应的多个方向,累积取决于所述多个度量的值,以使得能够确定声源方向。


2.根据权利要求1所述的装置,其中,在同一时间段针对多个频率分别确定所述度量,其中,所述装置被使得跨多个时间段和所述多个频率来累积取决于与相应的多个方向相关联的所述度量的值,以使得能够确定声源方向。


3.根据权利要求2所述的装置,其中,所述装置被使得用频率相关的加权来累积所述值,其中,在所述累积中,所述频率相关的加权对针对第一频率的取决于所述度量的值的加权多于对针对第二不同频率的取决于所述度量的值的加权。


4.根据权利要求1所述的装置,其中,所述元数据包括取决于所述直接声音的能量与所述其它声音的能量之比的值。


5.根据权利要求1所述的装置,其中,所述元数据包括:
第一元数据,当所述装置被使得进行累积时,其定义相应的多个方向;以及
第二元数据,当所述装置被使得确定所述度量时,其取决于相对于混响或环境声音量的所述直接声音的量。


6.根据权利要求1所述的装置,其中,所述元数据包括针对多个时间段的在同一时间段针对多个频率的元数据。


7.根据权利要求1所述的装置,其中,所述装置被使得借助直接音频模型来进行累积,所述直接音频模型由控制所述度量如何在角分布上被累积的核函数定义。


8.根据权利要求1所述的装置,其中,所述度量是直接能量度量,所述直接能量度量指示针对相应的多个方向的所述直接声音的能量。


9.根据权利要求8所述的装置,其中,所述直接能量度量是基于所述直接声音的能量与总声音能量之比。


10.根据权利要求9所述的装置,其中,所述直接能量度量是基于所述总声音能量,所述总声音能量是根据以下至少一个...

【专利技术属性】
技术研发人员:H·普拉卡M·哈玛莱南MV·莱蒂南
申请(专利权)人:诺基亚技术有限公司
类型:发明
国别省市:芬兰;FI

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1