The architecture of multiple microphone for acoustic source direction estimation and source separation and its location in equipment are proposed. The direction of the source is the front, back, left, right, top, and bottom of the device, and can be determined by the amplitude and phase difference of the microphone signal and the proper location of the microphone. Sound source separation separates voice from different directions from the mixing of sources in the microphone signal. This can be accomplished by blind source separation (BSS), independent component analysis (ICA) and beamforming (BF) technology. The device can perform a variety of audio enhancements for the device. For example, it can perform noise reduction for communication, which can select the source from the expected direction to perform speech recognition, and it can correct the sound perception direction in the microphone and generate the desired sound image, such as stereo audio output.
【技术实现步骤摘要】
【国外来华专利技术】用于声源方向估计的话筒放置背景包括监视器、膝上型计算机、平板计算机、蜂窝电话的现代电子设备或者具有音频能力的任何设备及系统使用至少一个话筒来拾取音频。取决于复杂度和成本之间的平衡,具有音频能力的电子设备通常使用一到四个话筒。当更多的话筒被用于设备时,如降噪、声源分离和音频输出增强之类的音频性能增加。在另一方面,当更多的话筒被使用时,制造成本及音频处理复杂度同样增加。概述提供本概述以便以简化的形式介绍以下在详细描述中进一步描述的概念的精选。本概述并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护主题的范围。本文中所描述的话筒放置实施方式呈现了设备中具有用来确定最大数量的源方向的最小数量的话筒的话筒定位架构。这些话筒放置实施方式提供具有数个话筒的架构及其在设备中的定位,以用于确定可被用于各种音频处理目的的声源方向估计及源分离。在一个示例性话筒放置实施方式中,具有音频能力的电子设备采用使用相对于设备的经定位的声源以准备被输入到应用中的输出的过程。该过程涉及接收从两个或更多个话筒接收到的声音的话筒信号。声源位置是相对于设备使用设备表面上的两个或更多个话筒的放置及由这些话筒接收到的声音的到达时间和幅值差来确定的。设备周围的空间使用经确定的声源位置被划分成诸区域。附加地,话筒信号要用于的应用的数量和类型以及所需输出信号的数量和类型被确定。经确定的区域被用来选择和处理来自期望的区域的话筒信号以近似地优化用于一个或多个应用的输出的信号。本文中所描述的诸话筒放置实施方式可具有许多优点。例如,它们可提供使用最小数量的话筒来确定最大数量的声源方向。它们还可 ...
【技术保护点】
一种过程,包括:接收从设备上的两个或更多个话筒接收到的声音的话筒信号;使用两个或更多个话筒在所述设备的表面上的放置以及由所述话筒接收到的声音的到达时间和幅值差来确定相对于所述设备的声源位置;使用经确定的声源位置来将所述设备周围的空间划分成各个区域;确定所述话筒信号要被用于的应用的数量和类型以及所需输出信号的数量和类型;以及使用所确定的区域来选择和处理来自期望区域的所述话筒信号以近似地优化用于所确定的一个或多个应用的输出的信号。
【技术特征摘要】
【国外来华专利技术】2015.09.09 US 14/848,7031.一种过程,包括:接收从设备上的两个或更多个话筒接收到的声音的话筒信号;使用两个或更多个话筒在所述设备的表面上的放置以及由所述话筒接收到的声音的到达时间和幅值差来确定相对于所述设备的声源位置;使用经确定的声源位置来将所述设备周围的空间划分成各个区域;确定所述话筒信号要被用于的应用的数量和类型以及所需输出信号的数量和类型;以及使用所确定的区域来选择和处理来自期望区域的所述话筒信号以近似地优化用于所确定的一个或多个应用的输出的信号。2.根据权利要求1所述的过程,其特征在于,将所述设备周围的空间分成各个区域进一步包括:从每个话筒的方向获得子空间,使得从所述子空间到其他话筒的声音的到达时间差大于0;基于所述话筒之间的幅值差来将每个子空间分成三个附加子空间;组合公共子空间,使得不存在重叠的子空间;将所述子空间组合成包含期望的子空间信号的多个期望的子空间;以及为经组合的子空间输出所述期望的子空间信号以供与所述一个或多个应用一起使用。3.根据权利要求1所述的过程,其特征在于,将所述设备周围的空间分成各个区域进一步包括:确定所述话筒之间的幅值差是大于正阈值、小于负阈值还是在所述正阈值和第二负阈值之间。4.根据权利要求3所述的过程,其特征在于,进一步包括经由二元、时不变或自适应解决方案来确定一个或多个区域中的源信号。5.根据权利要求3所述的过程,其特征在于,进一步包括确定一个或多个区域中的子空间信号,其中所述子空间信号的系数通过使用使所述子空间信号的失真最小化的概率分类器来获得。6.根据权利要求1所述的过程,其特征在于,应用的数量通过确定同时运行的应用的数量并将所确定的应用的数量乘以每个应用所要求的输出来确定。7.根据权利要求1所述的过程,其特征在于,输出到所确定的一个或多个应用的信号被近似优化以在通信应用中执行降噪。8.根据权利要求1所述的过程,其特征在于,输出到所确定的一个或多个应用的信号被近似优化以在语音识别应用中执行降噪...
【专利技术属性】
技术研发人员:Y·陆,C·B·戈,D·L·贝克,J·华,I·霍罗舍,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。