基于语音活动检测的音频的定向捕获制造技术

技术编号：22947988 阅读：21 留言：0更新日期：2019-12-27 17:50

本文档描述了一种技术，所述技术可具体表现在一种计算机实现的方法，所述方法包括接收表示由麦克风阵列捕获的音频的信息，其中所述信息包括多个数据集，每个数据集表示根据灵敏度图案沿相对于所述麦克风阵列的对应方向捕获的音频信号。所述方法还包括使用一个或多个处理设备来针对所述多个数据集中的每一者计算指示从所述对应方向捕获的人类语音活动的一个或多个量，以及至少基于针对多组所述多个数据集计算的所述一个或多个量来生成表示从特定方向捕获的音频的定向音频信号。

Audio directional capture based on voice activity detection

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】基于语音活动检测的音频的定向捕获
本公开整体涉及包括用于捕获声学信号的麦克风阵列的声学设备。
技术介绍
麦克风阵列可用于沿特定方向捕获声学信号。
技术实现思路
在一个方面，本文档的特征在于一种计算机实现的方法，该方法包括接收表示由麦克风阵列捕获的音频的信息，其中该信息包括多个数据集，每个数据集表示根据灵敏度图案沿相对于麦克风阵列的对应方向捕获的音频信号。该方法还包括使用一个或多个处理设备来针对多个数据集中的每一者计算指示从对应方向捕获的人类语音活动的一个或多个量，以及至少基于针对多组多个数据集计算的一个或多个量来生成表示从特定方向捕获的音频的定向音频信号。在另一方面，本文档的特征在于一种装置，该装置包括麦克风阵列、被配置为生成音频信号的一个或多个声换能器，以及包括存储器和一个或多个处理设备的音频处理引擎。音频处理引擎被配置为接收表示由麦克风阵列捕获的音频的信息，其中该信息包括多个数据集，每个数据集表示根据灵敏度图案沿相对于麦克风阵列的对应方向捕获的音频信号。音频处理引擎还被配置为针对多个数据集中的每一者计算指示从对应方向捕获的人类语音活动的一个或多个量，以及至少基于针对多组多个数据集计算的一个或多个量来生成表示从特定方向捕获的音频的定向音频信号。在另一方面，本文档的特征在于一个或多个机器可读存储设备，该一个或多个机器可读存储设备具有在其上编码的用于使一个或多个处理设备执行各种操作的计算机可读指令。这些操作包括接收表示由麦克风阵列捕获的音频的信息，其中该信息包括多个数据集，每个数据集...

【技术保护点】
1.一种方法，包括：/n接收表示由麦克风阵列捕获的音频的信息，其中所述信息包括多个数据集，每个数据集表示根据灵敏度图案沿相对于所述麦克风阵列的对应方向捕获的音频信号；/n使用一个或多个处理设备针对所述多个数据集中的每一者计算指示从所述对应方向捕获的人类语音活动的一个或多个量；以及/n至少基于针对多组所述多个数据集计算的所述一个或多个量来生成表示从特定方向捕获的音频的定向音频信号。/n

【技术特征摘要】
【国外来华专利技术】20170331 US 15/475,1911.一种方法，包括：
接收表示由麦克风阵列捕获的音频的信息，其中所述信息包括多个数据集，每个数据集表示根据灵敏度图案沿相对于所述麦克风阵列的对应方向捕获的音频信号；
使用一个或多个处理设备针对所述多个数据集中的每一者计算指示从所述对应方向捕获的人类语音活动的一个或多个量；以及
至少基于针对多组所述多个数据集计算的所述一个或多个量来生成表示从特定方向捕获的音频的定向音频信号。

2.根据权利要求1所述的方法，其中从被配置为处理使用所述麦克风阵列捕获的信号的波束形成器接收表示由所述麦克风阵列捕获的所述音频的所述信息。

3.根据权利要求2所述的方法，其中所述多个数据集中的每一者对应于使用所述波束形成器生成的波束。

4.根据权利要求2所述的方法，其中所述波束形成器是固定波束形成器或动态波束形成器中的一种。

5.根据权利要求1所述的方法，其中指示人类语音活动的所述一个或多个量包括人类语音活动在针对所述对应方向的所述数据集中表示的所述音频信号中的可能性分数。

6.根据权利要求1所述的方法，其中指示人类语音活动的所述一个或多个量包括信噪比(SNR)。

7.根据权利要求6所述的方法，其中所述SNR被计算为表示语音信号的第一量与表示非语音信号的第二量的比率。

8.根据权利要求1所述的方法，其中指示人类语音活动的所述一个或多个量表示在针对所述对应方向的所述数据集中表示的所述音频信号中存在关键词的可能性分数。

9.根据权利要求1所述的方法，其中生成所述定向音频信号包括选择所述多个数据集中的一个。

10.根据权利要求1所述的方法，其中生成所述定向音频信号包括使动态波束形成器根据针对所述特定方向生成的灵敏度图案来捕获音频。

11.一种装置，包括：
麦克风阵列；
一个或多个声换能器，所述一个或多个声换能器被配置为生成音频信号；和
音频处理引擎，所述音频处理引擎包括存储器和一个或多个处理设备，所述一个或多个处理设备被配置为：
接收表示由所述麦克风阵列捕获的所述音频的信息，其中所述信息包括多个数据集，每个数...

【专利技术属性】
技术研发人员：M·R·希克斯，D·R·克里斯特，A·R·莫吉米，
申请(专利权)人：伯斯有限公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人