使用两个麦克风进行轻型全360度音频源位置检测制造技术

技术编号：28538165 阅读：45 留言：0更新日期：2021-05-21 09:02

本公开涉及使用两个麦克风进行轻型全360度音频源位置检测。本文描述了一种系统。该系统包括至少一个硬件处理器，该硬件处理器被配置为识别预定声学屏障滤波器，其中，该声学屏障滤波器与物理声学屏障相一致，并且在时间窗口内在第一麦克风和第二麦克风处接收音频信号。硬件处理器还被配置为计算第一变化性度量、第二变化性度量、第三变化性度量、和第四变化性度量。硬件处理器还将第一变化性度量、第二变化性度量、第三变化性度量、和第四变化性度量相连以形成特征向量，并且将特征向量输入到位置分类器中以获得音频源位置。

全部详细技术资料下载

【技术实现步骤摘要】
使用两个麦克风进行轻型全360度音频源位置检测
本公开涉及人工智能领域，更具体地，涉及使用两个麦克风进行轻型全360度音频源位置检测。
技术介绍
确定音频源的空间位置有许多应用。例如，在智能环境或智能运输设备中，知晓音频源的位置是确定声音是来自预期用户、来自某些干扰、还是来自可用于情境感知的某附加来源的基础。音频源的空间位置的确定还使得能够在所选音频源上使用音频增强技术，以进行自动语音辨识(ASR)、发声者识别、音频事件检测、或者甚至碰撞避免。通常，实时音频定位需要多个麦克风阵列或复杂的信号处理和机器学习技术。
技术实现思路
本公开的实施例提供了一种系统。该系统包括：物理声学屏障；麦克风阵列，麦克风阵列包括第一麦克风和第二麦克风；至少一个硬件处理器，至少一个硬件处理器被配置为：识别预定声学屏障滤波器，其中，声学屏障滤波器与物理声学屏障相一致；在时间窗口内，在第一麦克风和第二麦克风处，接收音频信号；计算在第一麦克风和第二麦克风处接收到的音频信号的直接差的第一变化性度量；计算在第一麦克风和第二麦克风处接收到的...

【技术保护点】
1.一种系统，包括：/n物理声学屏障；/n麦克风阵列，所述麦克风阵列包括第一麦克风和第二麦克风；/n至少一个硬件处理器，所述至少一个硬件处理器被配置为：/n识别预定声学屏障滤波器，其中，所述声学屏障滤波器与所述物理声学屏障相一致；/n在时间窗口内，在所述第一麦克风和所述第二麦克风处，接收音频信号；/n计算在所述第一麦克风和所述第二麦克风处接收到的所述音频信号的直接差的第一变化性度量；/n计算在所述第一麦克风和所述第二麦克风处接收到的所述音频信号的延迟差的第二变化性度量；/n计算在所述第一麦克风和所述第二麦克风处接收到的所述音频信号的经滤波直接差的第三变化性度量，其中，该音频信号由所述预定声学屏...

【技术特征摘要】
20191120 US 16/689,5841.一种系统，包括：
物理声学屏障；
麦克风阵列，所述麦克风阵列包括第一麦克风和第二麦克风；
至少一个硬件处理器，所述至少一个硬件处理器被配置为：
识别预定声学屏障滤波器，其中，所述声学屏障滤波器与所述物理声学屏障相一致；
在时间窗口内，在所述第一麦克风和所述第二麦克风处，接收音频信号；
计算在所述第一麦克风和所述第二麦克风处接收到的所述音频信号的直接差的第一变化性度量；
计算在所述第一麦克风和所述第二麦克风处接收到的所述音频信号的延迟差的第二变化性度量；
计算在所述第一麦克风和所述第二麦克风处接收到的所述音频信号的经滤波直接差的第三变化性度量，其中，该音频信号由所述预定声学屏障滤波器进行滤波；
计算在所述第一麦克风和所述第二麦克风处接收到的所述音频信号的经滤波延迟差的第四变化性度量，其中，该音频信号由所述预定声学屏障滤波器进行滤波；
将所述第一变化性度量、所述第二变化性度量、所述第三变化性度量、以及所述第四变化性度量相连，以形成特征向量；以及
将所述特征向量输入到位置分类器中，以获得音频源位置。

2.根据权利要求1所述的系统，其中，所述预定声学屏障滤波器通过复制所述物理声学屏障滤波器的频率响应而与所述物理声学屏障滤波器相一致。

3.根据权利要求1所述的系统，其中，所述位置分类器是浅层神经网络。

4.根据权利要求1所述的系统，其中，所述第一变化性度量、所述第二变化性度量、所述第三变化性度量、和所述第四变化性度量是均方根值。

5.根据权利要求1所述的系统，其中，所述第一变化性度量、所述第二变化性度量、所述第三变化性度量、和所述第四变化性度量是均方根值。

6.根据权利要求1所述的系统，其中，所述预定声学屏障滤波器是与所述物理声学屏障滤波器相一致的带通滤波器。

7.根据权利要求1所述的系统，其中，所述物理声学屏障是改变来自音频源的音频信号的频率分量的表面。

8.根据权利要求1所述的系统，其中，差是通过以下操作来计算的：对所述第一麦克风和所述第二麦克风接收到的所述音频信号进行标准化，并且从经标准化的由所述第二麦克风捕获的音频信号中减去经标准化的由所述第一麦克风捕获的音频信号。

9.根据权利要求1所述的系统，其中，延迟的音频信号是通过将所述第二麦克风处的音频信号延迟预定数量的样本而生成的。

10.根据权利要求1所述...

【专利技术属性】
技术研发人员：赫克托·A·科尔多瓦·马鲁里，约瑟·R·卡马乔·佩雷斯，保罗·洛佩兹·迈耶，朱利欧·C·萨莫拉·埃斯基维尔，亚历杭德罗·伊巴拉·冯·博斯特尔，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人