用于基于所记录的声音信号进行头部跟踪的系统、方法、设备和计算机可读媒体技术方案

技术编号:8886792 阅读:230 留言:0更新日期:2013-07-05 03:47
本发明专利技术描述用于基于所记录的声音信号检测头部移动的系统、方法、设备和机器可读媒体。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频信号处理。
技术介绍
已通过使用一对头戴式送受话器或扩音器阵列来执行三维音频再现。然而,现有方法缺乏在线可控性,使得再现准确声音图像的稳健性受到限制。立体声头戴式耳机自身通常无法提供像外部扩音器阵列那样丰富的空间图像。在基于头部相关转移函数(HRTF)的头戴式送受话器再现的情况下,例如,声音图像通常局部化于用户头部中。结果,用户的深度和空间感觉可能受到限制。然而,在外部扩音器阵列的情况下,图像可能受限于相对较小的甜点(sweetspot)。图像也可能受到用户头部相对于阵列的位置和定向的影响。
技术实现思路
根据一般配置的一种音频信号处理方法包含:计算左麦克风信号与参考麦克风信号之间的第一交叉相关;以及计算右麦克风信号与参考麦克风信号之间的第二交叉相关。此方法还包含基于来自所述第一和第二计算出的交叉相关的信息来确定用户的头部的对应定向。在此方法中,所述左麦克风信号是基于由位于头部左侧的左麦克风产生的信号,所述右麦克风信号是基于由位于头部的与左侧相对的右侧的右麦克风产生的信号,且所述参考麦克风信号是基于由参考麦克风产生的信号。在此方法中,所述参考麦克风经定位使得:(A)当头部在第一方向上旋转时,所述左麦克风与所述参考麦克风之间的左距离减小,且所述右麦克风与所述参考麦克风之间的右距离增加,且(B)当头部在与所述第一方向相反的第二方向上旋转时,所述左距离增加,且所述右距离减小。还揭示具有有形特征的计算机可读存储媒体(例如,非暂时性媒体),所述有形特征致使所述机器读取所述特征以执行此方法。根据一般配置的一种音频信号处理设备包含:用于计算左麦克风信号与参考麦克风信号之间的第一交叉相关的装置;以及用于计算右麦克风信号与参考麦克风信号之间的第二交叉相关的装置。此设备还包含用于基于来自所述第一和第二计算出的交叉相关的信息来确定用户的头部的对应定向的装置。在此设备中,所述左麦克风信号是基于由位于头部左侧的左麦克风产生的信号,所述右麦克风信号是基于由位于头部的与左侧相对的右侧的右麦克风产生的 信号,且所述参考麦克风信号是基于由参考麦克风产生的信号。在此设备中,所述参考麦克风经定位使得:(A)当头部在第一方向上旋转时,所述左麦克风与所述参考麦克风之间的左距离减小,且所述右麦克风与所述参考麦克风之间的右距离增加,且(B)当头部在与所述第一方向相反的第二方向上旋转时,所述左距离增加,且所述右距离减小。根据另一一般配置的一种音频信号处理设备包含:左麦克风,其经配置以在所述设备的使用期间位于用户的头部的左侧;以及右麦克风,其经配置以在所述设备的使用期间位于所述头部的与所述左侧相对的右侧。此设备还包含:参考麦克风,其经配置以在所述设备的使用期间经定位而使得:(A)当头部在第一方向上旋转时,所述左麦克风与所述参考麦克风之间的左距离减小,且所述右麦克风与所述参考麦克风之间的右距离增加,且(B)当头部在与所述第一方向相反的第二方向上旋转时,所述左距离增加,且所述右距离减小。此设备还包含:第一交叉相关器,其经配置以计算基于由所述参考麦克风产生的信号的参考麦克风信号与基于由所述左麦克风产生的信号的左麦克风信号之间的第一交叉相关;第二交叉相关器,其经配置以计算所述参考麦克风信号与基于由所述右麦克风产生的信号的右麦克风信号之间的第二交叉相关;以及定向计算器,其经配置以基于来自所述第一和第二计算出的交叉相关的信息确定用户的头部的对应定向。附图说明图1A展示一对头戴式耳机D100L、D100R的实例。图1B展示一对耳塞。图2A和2B分别展示一对耳杯ECL10、ECRlO的前视图和俯视图。图3A展示根据一般配置的方法MlOO的流程图。图3B展示方法MlOO的实施方案MllO的流程图。图4A展示安装于一副眼用佩镜上的阵列ML10-MR10的例项的实例。图4B展示安装于头盔上的阵列ML10-MR10的例项的实例。图4C、5和6展示阵列ML10-MR10的轴线相对于传播方向的定向的实例的俯视图。图7展不参考麦克风MClO相对于用户身体的中央失状表面与中央冠状表面的位置。图8A展示根据一般配置的设备MF100的框图。图8B展示根据另--般配置的设备AlOO的框图。图9A展示设备MF100的实施方案MFl 10的框图。图9B展示设备AlOO的实施方案AllO的框图。图10展示包含麦克风阵列ML10-MR10和一对头戴式扩音器LLlO和LRlO的布置的俯视图。图1lA 到 12C 分别展示耳杯 ECRlO 的实施方案 ECR12、ECR14、ECR16、ECR22、ECR24和ECR26的水平横截面。图13A到13D展示头戴式耳机DlOO的实施方案D102的各种视图。图14A展示头戴式耳机DlOO的实施方案D104。图14B展示头戴式耳机DlOO的实施方案D106的视图。图14C展示耳塞EBlO的实例的前视图。图14D展示耳塞EBlO的实施方案EB12的前视图。图15展示麦克风ML10、MRlO和MVlO的使用。图16A展示方法MlOO的实施方案M300的流程图。图16B展示设备AlOO的实施方案A300的框图。图17A展示作为虚拟图像旋转器VRlO的音频处理级600的实施方案的实例。图17B展示作为左声道串音消除器CCLlO与右声道串音消除器CCRlO的音频处理级600的实施方案的实例。图18展示手持机HlOO的各种视图。图19展示手持型装置D800。图20A展示膝上型计算机D710的前视图。图20B展示显示装置TVlO。图20C展示显示装置TV20。图21展示用于自适应串音消除的反馈策略的说明。图22A展示方法MlOO的实施方案M400的流程图。图22B展示设备AlOO的实施方案A400的框图。图22C展示作为串音消除器CCLlO与CCRlO的音频处理级600的实施方案。图23展示头戴式扩音器和麦克风的布置。图24展示用于混合3D音频再现方案的概念图。图25A展示音频预处理级APlO。图25B展示音频预处理级APlO的实施方案AP20的框图。具体实施例方式现今,我们正经历着通过例如脸书(Facebook)、推特(Twitter)等快速增长的社交网络服务的个人信息的快速交换。与此同时,我们也看到网络速度和存储量的明显增长,这已经不仅支持文本,还支持多媒体数据。在此环境中,我们看到捕获和再现三维(3D)音频的重要需要,以实现个人听觉体验的更逼真且身临其境的交换。本专利技术描述用于基于多麦克风拓扑进行稳健且可信的声音图像重构的若干独特特征。除非明确地受其上下文限制,否则术语“信号”在本文中用以指示其普通意义中的任一者,包含如在导线、总线或其它传输媒体上表达的存储器位置(或存储器位置集合)的状态。除非明确地受其上下文限制,否则本文中使用术语“产生”来指示其普通意义中的任一者,例如,计算或以其它方式产生。除非明确地受其上下文限制,否则本文中使用术语“计算”来指示其普通意义中的任一者,例如,推算、评估、平滑化和/或从多个值中选择。除非明确地受其上下文限制,否则使用术语“获得”来指示其普通意义中的任一者,例如,计算、导出、接收(例如,从外部装置)和/或检索(例如,从存储元件阵列)。除非明确地受其上下文限制,否则使用术语“选择”来指示其普通意义中的任一者,本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:金莱轩向佩埃里克·维瑟
申请(专利权)人:高通股份有限公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1