使用波束形成的音频捕获制造技术

技术编号：21900546 阅读：34 留言：0更新日期：2019-08-17 19:40

一种音频捕获装置包括麦克风阵列(301)和波束形成器(303)，所述波束形成器被布置为生成波束形成的音频输出信号和噪声参考信号。第一和第二变换器(309、311)分别根据波束形成的音频输出信号和噪声参考信号的频率变换来生成第一和第二频域信号。差异处理器(313)生成时间频率瓦片差异量度，其针对给定频率指示第一频域信号的时间频率瓦片值的范数(幅值)的单调函数与针对第一频率的所述第二频域信号的时间频率瓦片值的范数的单调函数之间的差异。估计器(315)响应于针对频率阈值以上的频率的时间频率瓦片差异量度的组合差异值，生成指示音频输出信号是否包括点音频源的估计。

Audio capture using beamforming

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用波束形成的音频捕获
本专利技术涉及使用波束形成的音频捕获，并且特别地但非排他地涉及使用波束形成的语音捕获。
技术介绍
在过去几十年中，捕获音频，尤其是语音，已变得越来越重要。实际上，捕获语音对于包括电信、电话会议、游戏、音频用户接口等在内的各种应用已变得越来越重要。然而，在许多场景和应用中的问题是所需的语音源通常不是环境中的唯一音频源。相反，在典型的音频环境中，存在正在由麦克风捕获许多其他音频/噪声源。许多语音捕获应用程序面临的一个关键问题是如何在嘈杂的环境中最好地提取语音。为了解决这个问题，已经提出了许多不同的噪声抑制方法。实际上，例如免提语音通信系统中的研究是几十年来备受关注的话题。第一个商业系统专注于专业(视频)会议系统，其具有低背景噪音和短混响时间。发现用于识别和提取期望音频源(例如期望的发言者)的特别有利的方法是基于来自麦克风阵列的信号的波束形成的使用。最初，麦克风阵列通常与聚焦固定波束一起使用，但后来自适应波束的使用变得更加流行。在20世纪90年代后期，手机的免提系统开始引入。这些旨在用于许多不同的环境，包括混响房间和(较)高背景噪音水平。这种音频环境提供了显著更困难的挑战，并且特别是可能使形成的波束的调整变得复杂或劣化。最初，针对这样的环境的音频捕获研究主要关注回声消除，并且后来关注噪声抑制。基于波束形成的音频捕获系统的示例在图1中示出。在该示例中，多个麦克风101的阵列被耦合到波束形成器103，波束形成器103生成音频源信号z(n)和一个或多个噪声参考信号x(n)。在一些实施例中，麦克风阵列101可以仅包括两个麦克风，但通常包括更高的数...

【技术保护点】
1.一种音频捕获装置，包括：麦克风阵列(301)；至少第一波束形成器(303)，其被布置为生成波束形成的音频输出信号和至少一个噪声参考信号；第一变换器(309)，其用于根据对所述波束形成的音频输出信号的频率变换来生成第一频域信号，所述第一频域信号由时间频率瓦片值表示；第二变换器(311)，其用于根据所述至少一个噪声参考信号的频率变换来生成第二频域信号，所述第二频域信号由时间频率瓦片值表示；差异处理器(313)，其被布置为生成时间频率瓦片差异量度，针对第一频率的时间频率瓦片差异量度指示针对所述第一频率的所述第一频域信号的时间频率瓦片值的范数的第一单调函数与针对所述第一频率的所述第二频域信号的时间频率瓦片值的范数的第二单调函数之间的差异；点音频源估计器(315)，其用于生成指示所述波束形成的音频输出信号是否包括点音频源的点音频源估计，所述点音频源估计器(315)被布置为响应于针对高于频率阈值的频率的时间频率瓦片差异量度的组合差异值而生成所点述音频源估计。

【技术特征摘要】
【国外来华专利技术】2017.01.03 EP 17150115.81.一种音频捕获装置，包括：麦克风阵列(301)；至少第一波束形成器(303)，其被布置为生成波束形成的音频输出信号和至少一个噪声参考信号；第一变换器(309)，其用于根据对所述波束形成的音频输出信号的频率变换来生成第一频域信号，所述第一频域信号由时间频率瓦片值表示；第二变换器(311)，其用于根据所述至少一个噪声参考信号的频率变换来生成第二频域信号，所述第二频域信号由时间频率瓦片值表示；差异处理器(313)，其被布置为生成时间频率瓦片差异量度，针对第一频率的时间频率瓦片差异量度指示针对所述第一频率的所述第一频域信号的时间频率瓦片值的范数的第一单调函数与针对所述第一频率的所述第二频域信号的时间频率瓦片值的范数的第二单调函数之间的差异；点音频源估计器(315)，其用于生成指示所述波束形成的音频输出信号是否包括点音频源的点音频源估计，所述点音频源估计器(315)被布置为响应于针对高于频率阈值的频率的时间频率瓦片差异量度的组合差异值而生成所点述音频源估计。2.根据权利要求1所述的音频捕获装置，其中，所述点音频源估计器(315)被布置为响应于所述组合差异值超过阈值而检测所述波束形成的音频输出中的点音频源的存在。3.根据权利要求1所述的音频捕获装置，其中，所述频率阈值不低于500Hz。4.根据权利要求1所述的音频捕获装置，其中，所述差异处理器(313)被布置为生成噪声相干估计，所述噪声相干估计指示所述波束形成的音频输出信号的幅值与所述至少一个噪声参考信号的幅值之间的相关性；并且所述第一单调函数和所述第二单调函数中的至少一个取决于所述噪声相干估计。5.根据权利要求1所述的音频捕获装置，其中，所述差异处理器(313)被布置为响应于所述噪声相干估计而相对于针对所述第一频率的所述第二频域信号的时间频率瓦片值的范数来缩放针对所述第一频率的所述第一频域信号的时间频率瓦片值的范数。6.根据权利要求1所述的音频捕获装置，其中，所述差异处理器(313)被布置为将针对时间tk在频率ωl的所述时间频率瓦片差异量度生成为基本如下：d＝|Z(tk,ωl)|-γC(tk,ωl)|X(tk,ωl)|其中，Z(tk,ωl)是针对所述波束形成的音频输出信号在时间tk在频率ωl的所述时间频率瓦片值；X(tk,ωl)是针对所述至少一个噪声参考信号在时间tk在频率ωl的所述时间频率瓦片值；C(tk,ωl)是在时间tk在频率ωl的噪声相干估计；并且γ是设计参数。7.根据权利要求1所述的音频捕获装置，其中，所述差异处理器(313)被布置为对所述波束形成的音频输出信号的所述时间频率瓦片值和所述至少一个噪声参考信号的所述时间频率瓦片值中的至少一个进行滤波。8.根据权利要求6所述的音频捕获装置，其中，所述滤波在频率方向和时间方向两者上进行。9.根据权利要求1所述的音频捕获装置，包括多个波束形成器(705、709、711)，所述多个波束形成器包括所述波束形成器(705)；并且所述点音频源估计器(315)被布置为...

【专利技术属性】
技术研发人员：C·P·扬瑟，P·克基基安，
申请(专利权)人：皇家飞利浦有限公司，
类型：发明
国别省市：荷兰,NL

全部详细技术资料下载我是这个专利的主人