使用相干性的信号分量估计制造技术

技术编号:31567335 阅读:15 留言:0更新日期:2021-12-25 11:04
本发明专利技术公开了接收表示使用麦克风捕获的音频的输入信号的系统、方法和机器可读存储设备。该输入信号包括表示来自一个或多个音频源的声学输出的多个部分,以及表示环境中的其他声能的一部分。迭代地修改该输入信号的频域表示,以显著减小由于除了该多个部分中的所选择的一者之外的所有部分而导致的影响,由此表示来确定对所选择的一部分的功率谱密度(PSD)的估计。基于所估计的PSD,减小噪声或回声分量,或者提供替换噪声。该迭代修改涉及交叉频谱密度矩阵的对角化,以移除与其他信号的自动频谱和交叉频谱中的第一音频输入相干的内容。和交叉频谱中的第一音频输入相干的内容。和交叉频谱中的第一音频输入相干的内容。

【技术实现步骤摘要】
【国外来华专利技术】使用相干性的信号分量估计
[0001]优先权声明
[0002]本申请要求于2019年5月1日提交的标题为“SIGNAL COMPONENT ESTIMATION USING COHERENCE”的美国申请62/841,608的优先权,该申请的全部内容以引用方式并入本文。

技术介绍

[0003]许多音频系统在空间中检测声音并产生声音,诸如汽车音频系统、会议室系统、电话系统等。这些系统可包括回放换能器,例如扬声器,并且还可包括一个或多个麦克风。在各种示例中,空间中的声能可包括由系统播放的音频、期望的信号(诸如用户语音)以及来自其他源的音频,该音频可包括噪声。来自音频系统的回放音频可为例如娱乐音频、来自远端参与者的音频或其他音频。一个或多个麦克风可接收这些声学信号中的任一者或全部,并且对于各种应用,可存在对估计麦克风信号中的任何回放音频、噪声或其他信号分量的功率谱密度(PSD)的益处。

技术实现思路

[0004]在一个方面,提供了一种用于估计所选择的信号分量的功率谱密度的方法,该方法包括在一个或多个处理设备处接收表示使用麦克风捕获的音频的输入信号。该输入信号至少包括表示来自环境中的第一音频源(例如,第一扬声器)的声学输出的第一部分和表示环境中的其他声能的第二部分(诸如噪声分量)。该方法还包括由一个或多个处理设备迭代地修改输入信号的频域表示。所修改的频域表示表示输入信号的一部分,在该部分中由于除了第一部分或第二部分中的所选择的一者之外的全部而导致的影响显著减小。该方法还可包括根据所修改的频域表示来确定对所选择的部分的功率谱密度的估计。
[0005]在另一方面,提供了一种包括具有一个或多个处理设备的信号分析引擎的系统。该信号分析引擎被配置为接收表示使用麦克风捕获的音频的输入信号。该输入信号至少包括表示来自环境中的第一音频源(例如,第一扬声器)的声学输出的第一部分和表示环境中的其他声能的第二部分(诸如噪声分量)。信号分析引擎还被配置为迭代地修改输入信号的频域表示。所修改的频域表示表示输入信号的一部分,在该部分中由于除了第一部分或第二部分中的所选择的一者之外的全部而导致的影响显著减小。信号分析引擎还被配置为根据所修改的频域表示来确定对所选择的部分的功率谱密度的估计。
[0006]在另一方面,本文档的特征在于一个或多个机器可读存储设备,该一个或多个机器可读存储设备具有在其上编码的用于使一个或多个处理设备执行各种操作来执行上述方法或实施上述系统的计算机可读指令。
[0007]上述方面的具体实施可以包括以下特征中的一个或多个。
[0008]在各种示例中,输入信号可包括附加部分,附加部分中的每个表示环境中的附加音频源(例如,附加扬声器)。所选择的部分可为附加部分中的任一者。
[0009]所选择的部分可为第二部分,并且所估计的功率谱密度可表示环境中的其他声
能,诸如噪声。此类噪声估计功率谱密度可由降噪系统用于减少来自麦克风信号的噪声和/或可用于替换静态通信系统中的噪声。所选择的部分可为第一部分,并且所估计的功率谱密度可表示回声,该回声可应用于残余回声抑制系统。针对每个频率窗口,频域表示可包括以下各项中的一者或多者:(i)各自表示一个或多个音频源的声学输出之间的相干水平的值,(ii)各自表示音频源中的特定一个音频源的声学输出与输入信号之间的相干水平的值,以及(iii)各自表示音频源中的单独一个音频源的特定频率窗口的声学输出的功率的值。频域表示可包括基于一个或多个音频源的输出而计算的交叉频谱密度矩阵。迭代地修改频域表示可包括对交叉频谱密度矩阵执行矩阵对角化过程。
[0010]在一些具体实施中,本文所述的技术可提供以下优点中的一者或多者。
[0011]通过导出输入信号的所选择部分的功率谱密度,可直接计算关于所选择部分的频率特定信息(该频率特定信息可在各种应用中直接使用),而不会在确定所选择部分的时间波形时浪费计算资源。可基于使用单个麦克风捕获的输入信号来实现的技术可利用多个(输入)音频源来扩展。高度相关的输入音频源可简单地通过省略本文所述的矩阵运算中的一个或多个行缩减步骤来处理。在一些情况下,这可相对于在存在相关源时经常发生故障的自适应滤波技术提供显著改进。
[0012]本公开中所述的两个或更多个特征,包括本
技术实现思路
部分中所述的那些,可组合以形成在本文未具体描述的实施方式。
[0013]一个或多个具体实施的细节在附图和以下描述中论述。其他特征、对象和优点在说明书、附图和权利要求书中将是显而易见的。
附图说明
[0014]图1是用于调整车辆车厢内输出音频的示例性系统的框图。
[0015]图2是其中可实现本文所述的技术的示例性环境的框图。
[0016]图3是可用于实现本文所述的技术的示例性系统的框图。
[0017]图4是用于估计噪声信号的功率谱密度的示例性过程的流程图。
具体实施方式
[0018]本文档中描述的技术涉及将噪声信号与表示来自音频系统和噪声源两者的所捕获的音频的麦克风信号分离。这可用于例如汽车音频系统中,该汽车音频系统响应于车辆车厢内变化的噪声条件而连续且自动地调整音频再现,以提供均匀/一致的感知音频体验。这还可用于降低麦克风信号的噪声内容,例如,用于免提通信应用,诸如通过频谱减法或后滤波,和/或用于在远端静止(不存在传输信号)时估计要添加到电话线路的“舒适噪声”。
[0019]此类音频系统可包括麦克风,该麦克风通常放置在车辆车厢内以测量噪声。此类系统可取决于将系统音频的贡献与麦克风信号中的噪声分离。本文档描述了涉及基于估计成对的声换能器之间的相干性以及每个声换能器和麦克风信号之间的相干性来从麦克风信号移除来自多个声换能器或音频系统的多个输入通道的贡献的技术。使用频域中的矩阵运算迭代地完成估计和移除,该矩阵运算直接生成时变噪声的功率谱密度的估计。直接计算此类频率特定信息而不首先估计噪声的对应时域估计导致计算资源的节省,特别是对于其中针对不同频带单独进行增益调整的音频系统。本文所述的技术可使用由单个麦克风捕
获的信号来实现,并且可扩展以用于增加底层音频系统中的通道/声换能器的数量。
[0020]图1是用于调整车辆车厢内输出音频的示例性系统100的框图。首先分析输入音频信号105以确定输入音频信号105的当前水平。这可例如通过源分析引擎110来完成。并行地,噪声分析引擎115可被配置为分析车辆车厢内存在的噪声的水平和分布。在一些具体实施中,噪声分析引擎可被配置为利用多个输入,诸如麦克风信号104和一个或多个辅助噪声输入106,包括例如指示车辆速度、加热、通风和空调系统(HVAC)的风扇速度设置等的输入。在一些具体实施中,可部署响度分析引擎120来分析源分析引擎110的输出和噪声分析引擎115的输出,以计算保持音频输出的感知质量所需的任何增益调整。在一些具体实施中,目标SNR可指示在存在稳态噪声的情况下在车辆车厢内感知到的输入音频105的质量/水平。响度分析引擎可被配置为生成控制增益调整电路125的控制信号,该控本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于估计信号分量的功率谱密度的方法,所述方法包括:在一个或多个处理设备处,接收表示使用麦克风捕获的音频的输入信号,所述输入信号至少包括表示来自环境中的第一音频源的声学输出的第一部分和表示所述环境中的其他声能的第二部分;由所述一个或多个处理设备迭代地修改所述输入信号的频域表示,使得所修改的频域表示表示所述输入信号的一部分,在所述部分中由于除了所述第一部分和所述第二部分中的所选择的一者之外的全部而导致的影响显著减小;根据所修改的频域表示来确定对所选择的部分的功率谱密度的估计;以及以下中的至少一者:基于所估计的功率谱密度来减少麦克风信号中的噪声或回声,或者基于所估计的功率谱密度来将噪声插入远端系统。2.根据权利要求1所述的方法,其中对于多个频率窗口中的每个频率窗口,所述频域表示包括:(i)各自表示针对特定频率窗口的所述第一音频源的声学输出的功率的值,以及(ii)各自表示所述第一音频源的所述声学输出和所述输入信号之间的相干水平的值。3.根据权利要求1所述的方法,其中所述频域表示包括基于所述第一音频源的输出而计算的交叉频谱密度矩阵。4.根据权利要求3所述的方法,其中迭代地修改所述频域表示包括对所述交叉频谱密度矩阵执行矩阵对角化过程。5.根据权利要求1所述的方法,其中所述输入信号包括表示来自所述环境中的第二音频源的声学输出的第三部分,并且其中所选择的部分是所述第一部分、所述第二部分或所述第三部分中的一者。6.根据权利要求5所述的方法,其中对于多个频率窗口中的每个频率窗口,所述频域表示包括:(i)各自表示来自所述第一音频源的声学输出和来自所述第二音频源的声学输出之间的相干水平的值,(ii)各自表示所述第一音频源和所述第二音频源中的特定一个音频源的声学输出与所述输入信号之间的相干水平的值,以及(iii)各自表示所述第一音频源和所述第二音频源中的一者的针对特定频率窗口的所述声学输出的功率的值。7.根据权利要求5所述的方法,其中所述频域表示包括基于所述第一音频源的输出和所述第二音频源的输出而计算的交叉频谱密度矩阵。8.根据权利要求7所述的方法,其中迭代地修改所述频域表示包括对所述交叉频谱密度矩阵执行矩阵对角化过程。9.一种系统,包括:信号分析引擎,所述信号分析引擎包括一个或多个处理设备,所述信号分析引擎被配置为:接收表示使用麦克风捕获的音频的输入信号,所述输入信号至少包括表示来自环境中的第一音频源的声学输出的第一部分和表示所述环境中的其他声能的第二部分;迭代地修改所述输入信号的频域表示,使得所修改的频域表示表示所述输入信号的一
部分,在所述部分中由于除了所述第一部分和所述第二部分中的所选择的一者之外的全部而导致的影响显著减小;根据所修改的频域表示来确定对所选择的部分的功率谱密度的估计;以及以下中的至少一者:基于所估计的功率谱密度来减少麦克风信号中的噪声或回声,或者基于所估计的功率谱密度来将噪声插入远端系统。10.根据权利要求9所述的系统,其中对于多个频率窗口中的每个频率窗口,所述频域表示包括:(i)各自表示针对特定频率窗口的所述第一音频源的声学输出的功率的值,以及(ii)各自表示所述第一音频源的所述声学输出和所述输入信号之间的相干水平的值。11.根据权利要求9所述的系统,其中所述频域表示包括基于所述第一音频源的输出而计算的交叉频谱密度矩阵。12.根据权利要求11所述的系统,其中迭代地修改所述频域表示包...

【专利技术属性】
技术研发人员:张绍勋宋祖揆C
申请(专利权)人:伯斯有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1