使用相干性的信号分量估计制造技术

技术编号：31567335 阅读：15 留言：0更新日期：2021-12-25 11:04

本发明专利技术公开了接收表示使用麦克风捕获的音频的输入信号的系统、方法和机器可读存储设备。该输入信号包括表示来自一个或多个音频源的声学输出的多个部分，以及表示环境中的其他声能的一部分。迭代地修改该输入信号的频域表示，以显著减小由于除了该多个部分中的所选择的一者之外的所有部分而导致的影响，由此表示来确定对所选择的一部分的功率谱密度(PSD)的估计。基于所估计的PSD，减小噪声或回声分量，或者提供替换噪声。该迭代修改涉及交叉频谱密度矩阵的对角化，以移除与其他信号的自动频谱和交叉频谱中的第一音频输入相干的内容。和交叉频谱中的第一音频输入相干的内容。和交叉频谱中的第一音频输入相干的内容。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用相干性的信号分量估计
[0001]优先权声明
[0002]本申请要求于2019年5月1日提交的标题为“SIGNAL COMPONENT ESTIMATION USING COHERENCE”的美国申请62/841,608的优先权，该申请的全部内容以引用方式并入本文。

技术介绍

[0003]许多音频系统在空间中检测声音并产生声音，诸如汽车音频系统、会议室系统、电话系统等。这些系统可包括回放换能器，例如扬声器，并且还可包括一个或多个麦克风。在各种示例中，空间中的声能可包括由系统播放的音频、期望的信号(诸如用户语音)以及来自其他源的音频，该音频可包括噪声。来自音频系统的回放音频可为例如娱乐音频、来自远端参与者的音频或其他音频。一个或多个麦克风可接收这些声学信号中的任一者或全部，并且对于各种应用，可存在对估计麦克风信号中的任何回放音频、噪声或其他信号分量的功率谱密度(PSD)的益处。

技术实现思路

[0004]在一个方面，提供了一种用于估计所选择的信号分量的功率谱密度的方法，该方法包括在一个或多个处理设备处接收表示使用麦克风捕获的音频的输入信号。该输入信号至少包括表示来自环境中的第一音频源(例如，第一扬声器)的声学输出的第一部分和表示环境中的其他声能的第二部分(诸如噪声分量)。该方法还包括由一个或多个处理设备迭代地修改输入信号的频域表示。所修改的频域表示表示输入信号的一部分，在该部分中由于除了第一部分或第二部分中的所选择的一者之外的全部而导致的影响显著减小。该方法还可包括根据所修改的频域表示来确定对所选择的部分的功...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于估计信号分量的功率谱密度的方法，所述方法包括：在一个或多个处理设备处，接收表示使用麦克风捕获的音频的输入信号，所述输入信号至少包括表示来自环境中的第一音频源的声学输出的第一部分和表示所述环境中的其他声能的第二部分；由所述一个或多个处理设备迭代地修改所述输入信号的频域表示，使得所修改的频域表示表示所述输入信号的一部分，在所述部分中由于除了所述第一部分和所述第二部分中的所选择的一者之外的全部而导致的影响显著减小；根据所修改的频域表示来确定对所选择的部分的功率谱密度的估计；以及以下中的至少一者：基于所估计的功率谱密度来减少麦克风信号中的噪声或回声，或者基于所估计的功率谱密度来将噪声插入远端系统。2.根据权利要求1所述的方法，其中对于多个频率窗口中的每个频率窗口，所述频域表示包括：(i)各自表示针对特定频率窗口的所述第一音频源的声学输出的功率的值，以及(ii)各自表示所述第一音频源的所述声学输出和所述输入信号之间的相干水平的值。3.根据权利要求1所述的方法，其中所述频域表示包括基于所述第一音频源的输出而计算的交叉频谱密度矩阵。4.根据权利要求3所述的方法，其中迭代地修改所述频域表示包括对所述交叉频谱密度矩阵执行矩阵对角化过程。5.根据权利要求1所述的方法，其中所述输入信号包括表示来自所述环境中的第二音频源的声学输出的第三部分，并且其中所选择的部分是所述第一部分、所述第二部分或所述第三部分中的一者。6.根据权利要求5所述的方法，其中对于多个频率窗口中的每个频率窗口，所述频域表示包括：(i)各自表示来自所述第一音频源的声学输出和来自所述第二音频源的声学输出之间的相干水平的值，(ii)各自表示所述第一音频源和所述第二音频源中的特定一个音频源的声学输出与所述输入信号之间的相干水平的值，以及(iii)各自表示所述第一音频源和所述第二音频源中的一者的针对特定频率窗口的所述声学输出的功率的值。7.根据权利要求5所述的方法，其中所述频域表示包括基于所述第一音频源的输出和所述第二音频源的输出而计算的交叉频谱密度矩阵。8.根据权利要求7所述的方法，其中迭代地修改所述频域表示包括对所述交叉频谱密度矩阵执行矩阵对角化过程。9.一种系统，包括：信号分析引擎，所述信号分析引擎包括一个或多个处理设备，所述信号分析引擎被配置为：接收表示使用麦克风捕获的音频的输入信号，所述输入信号至少包括表示来自环境中的第一音频源的声学输出的第一部分和表示所述环境中的其他声能的第二部分；迭代地修改所述输入信号的频域表示，使得所修改的频域表示表示所述输入信号的一
部分，在所述部分中由于除了所述第一部分和所述第二部分中的所选择的一者之外的全部而导致的影响显著减小；根据所修改的频域表示来确定对所选择的部分的功率谱密度的估计；以及以下中的至少一者：基于所估计的功率谱密度来减少麦克风信号中的噪声或回声，或者基于所估计的功率谱密度来将噪声插入远端系统。10.根据权利要求9所述的系统，其中对于多个频率窗口中的每个频率窗口，所述频域表示包括：(i)各自表示针对特定频率窗口的所述第一音频源的声学输出的功率的值，以及(ii)各自表示所述第一音频源的所述声学输出和所述输入信号之间的相干水平的值。11.根据权利要求9所述的系统，其中所述频域表示包括基于所述第一音频源的输出而计算的交叉频谱密度矩阵。12.根据权利要求11所述的系统，其中迭代地修改所述频域表示包...

【专利技术属性】
技术研发人员：张绍勋，宋祖揆，C，
申请(专利权)人：伯斯有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人