当前位置: 首页 > 专利查询>ams有限公司专利>正文

用于耳戴式播放设备的语音活动检测的音频系统和信号处理方法技术方案

技术编号:32085995 阅读:18 留言:0更新日期:2022-01-29 18:07
一种用于耳戴式播放设备(HP)的音频系统,包括:扬声器(SP)、误差麦克风(FB_MIC),其主要感测从扬声器(SP)输出的声音以及前馈麦克风(FF_MIC),其主要感测周围环境声音。音频系统还包括语音活动检测器(VAD),该语音活动检测器配置为记录来自前馈麦克风(FF_MIC)的前馈信号(FF)。此外,记录来自误差麦克风(FB_MIC)的误差信号(ERR)。根据前馈信号(FF)和误差信号(ERR)确定检测参数。监测检测参数并且根据检测参数设置语音活动状态。检测参数设置语音活动状态。检测参数设置语音活动状态。

【技术实现步骤摘要】
【国外来华专利技术】用于耳戴式播放设备的语音活动检测的音频系统和信号处理方法


[0001]本公开内容涉及用于耳戴式播放设备的语音活动检测的音频系统和信号处理方法,耳戴式播放设备例如包括扬声器、误差麦克风和前馈麦克风的耳机。

技术介绍

[0002]现今,越来越多的耳机或耳塞配备了噪声消除技术。例如,这种噪声消除技术被称为主动噪声消除或环境噪声消除,两者均缩写为ANC。ANC通常利用所记录的环境噪声进行处理以产生抗噪信号,然后将其与有用的音频信号进行组合,以通过耳机的扬声器播放。ANC也可以用于其他音频设备,例如手机或移动电话。各种ANC方法都使用反馈FB麦克风或误差麦克风、前馈FF麦克风或者反馈麦克风和前馈麦克风的组合。FF和FB ANC是通过基于音频系统的给定声学来调谐滤波器而实现的。
[0003]混合噪声消除耳机是众所周知的。例如,麦克风放置在直接耦合到耳鼓的空间内,通常靠近耳机驱动器的前部。这被称为反馈FB麦克风或误差麦克风。第二麦克风,即前馈FF麦克风,放置在耳机的外部,使得该第二麦克风与耳机驱动器声学上去耦。
[0004]常规环境噪声消除耳机的特点在于驱动器在其前后具有空气空间。前部空间部分地由佩戴耳机的用户的耳道空间构成。前部空间通常由覆盖有声学电阻器的通气口组成。后部空间的特点也通常在于具有声学电阻器的通气口。通常,前部空间通气口声学上耦合前部空间与后部空间。每个左右声道有两个麦克风。误差麦克风或反馈FB麦克风放置在靠近驱动器的位置,使得该误差麦克风或反馈FB麦克风检测来自驱动器的声音和来自周围环境的声音。前馈FF麦克风从单元后部面向外放置,使得该前馈FF麦克风检测周围环境声音和来自驱动器的可忽略的声音。
[0005]利用这种布置,可以进行两种形式的噪声消除,即前馈FF和反馈FB。两种系统都涉及放置在麦克风与驱动器之间的滤波器。前馈系统检测耳机外部的噪声,经由滤波器处理该噪声,并从驱动器输出抗噪声信号,使得抗噪声信号与噪声信号在耳朵处发生叠加以产生噪声消除。信号路径如下:
[0006]ERR=AE

AM.F.DE
[0007]其中,ERR是耳朵处的残余噪声,AE是环境到耳朵的声学传递函数,AM是环境到FF麦克风的声学传递函数,F是FF滤波器,DE是驱动器到耳朵的声学传递函数。所有信号在频域中都是复数,因此包含振幅和相位分量。因此,可以得出,对于完美的噪声消除,ERR趋于零:
[0008][0009]然而,实际上,声学传递函数可能根据耳机的佩戴情况而改变。对于泄漏的耳塞,可能存在将前部空间声学上耦合到周围环境的高度可变的泄漏,并且传递函数AE和DE基本上会改变,使得需要根据耳道中的声学信号来使FF滤波器适应以最小化误差。遗憾的是,当
耳机用户说话时,在麦克风处的信号变成与骨传导语音信号混合,并可能导致自适应过程中的误差和假零。

技术实现思路

[0010]目的是提供一种语音活动检测的音频系统和信号处理方法,其允许改进语音活动检测,例如,检测音频系统用户的耳道中存在的语音。
[0011]这些目的通过独立权利要求的主题来实现。在从属权利要求中描述进一步的改进和实施例。
[0012]应当理解,与任何一个实施例相关的任何特征可以单独使用,或与本文所述的其他特征组合使用,也可以与任何其他实施例的一个或更多个特征组合使用,或与任何其他实施例的任何组合组合使用,除非描述为替代。此外,在不脱离所附权利要求所限定的语音活动检测的音频系统和方法的范围的情况下,也可以采用下文未描述的等同部分和修改。
[0013]以下涉及环境噪声消除领域中的改进构思。改进的构思允许例如在播放设备中实施语音活动检测,该播放设备例如是需要第一人称语音活动检测器的耳机,该第一人称语音活动检测器对于自适应ANC过程、声学开关耳朵检测和语音命令可能是必需的。改进的构思可以应用于泄漏耳塞的自适应ANC。术语“自适应”指代根据将设备的前部空间声学上耦合到周围环境的泄漏来使抗噪声信号适应。语音活动检测器使用两个麦克风之间的关系来检测用户的语音而不是第三人称的语音,并且使用两个麦克风之间的关系来检测耳机场景中的用户语音。改进的构思还着眼于简单的参数,以使处理量保持在最小值。
[0014]改进的构思可以不检测第三人称语音,这意味着在自适应ANC耳机背景下,自适应仅止于用户说话时(即第一人称),而不是第三方,从而最大化自适应带宽。它可以只检测骨传导语音。
[0015]改进的构思可以用简单的算法进行实施,这从根本上意味着其能够以比某些算法更低的功率(在较低规格的设备上)运行。
[0016]改进的构思不依赖于检测语音之间的周围环境声音周期作为参考(例如相干方法)。本质上,其参考本质上是麦克风之间的已知相位关系。因此其能够快速判断是否有声音。
[0017]在至少一个实施例中,用于耳戴式播放设备的音频系统包括扬声器、主要感测从扬声器输出的声音的误差麦克风和主要感测周围环境声音的前馈麦克风。音频系统还包括语音活动检测器,该语音活动检测器配置为执行以下步骤,包括记录来自前馈麦克风的前馈信号和记录来自误差麦克风的误差信号。根据前馈信号和误差信号确定检测参数。监测检测参数并根据检测参数设置语音活动状态。
[0018]在至少一个实施例中,检测参数基于前馈信号与误差信号的比率。
[0019]在至少一个实施例中,检测参数还基于声音信号。
[0020]在至少一个实施例中,检测参数是前馈信号与误差信号之间的振幅差异。检测参数可以指示ANC性能,例如,ANC性能由麦克风之间的振幅的比率确定。
[0021]在至少一个实施例中,检测参数是误差信号与前馈信号之间的相位差异。
[0022]在至少一个实施例中,音频系统还包括耦合到前馈麦克风和误差麦克风的自适应噪声消除控制器。自适应噪声消除控制器配置为根据前馈信号和/或误差信号执行噪声消
除处理。滤波器耦合到前馈麦克风和扬声器,并且具有通过噪声消除处理确定的滤波器传递函数。
[0023]在至少一个实施例中,噪声消除处理包括前馈噪声消除处理或反馈噪声消除处理或者前馈噪声消除处理和反馈噪声消除处理两者。
[0024]在至少一个实施例中,检测参数指示噪声消除处理的性能。
[0025]在至少一个实施例中,语音活动检测器过程确定以下语音活动状态之一:假、真或可能。检测状态等于“真”指示检测到语音。检测状态等于“假”指示未检测到语音。检测状态等于“可能”指示语音为可能。
[0026]在至少一个实施例中,语音活动检测器根据语音活动状态控制自适应噪声消除控制器。
[0027]在至少一个实施例中,控制自适应噪声消除控制器包括,在语音活动状态设置为“真”和/或“可能”的情况下,终止噪声消除处理的噪声消除信号的自适应。在语音活动状态设置为“假”的情况下,继续噪声消除信号的自适应。
[0028]在至少一个实施例中,在第一操作模式下,语音活动检测器分析前馈信号与误差信号之间的相位差异。根据所分析本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于耳戴式播放设备(HP)的音频系统,包括:

扬声器(SP),

误差麦克风(FB_MIC),其感测从所述扬声器输出的声音和周围环境声音(SP),以及

前馈麦克风(FF_MIC),其主要感测周围环境声音,其中,所述音频系统包括语音活动检测器(VAD),所述语音活动检测器配置为:

记录来自所述前馈麦克风(FF_MIC)的前馈信号(FF),

记录来自所述误差麦克风(FB_MIC)的误差信号(ERR),

根据所述前馈信号(FF)和所述误差信号(ERR)确定至少一个检测参数,以及

监测所述至少一个检测参数,并根据所述至少一个检测参数设置语音活动状态。2.根据前述权利要求所述的音频系统,其中,所述检测参数:

基于所述前馈信号(FF)与所述误差信号(ERR)的比率,

是所述误差信号与所述前馈信号之间的相位差异,或者

还基于声音信号(MUS)。3.根据前述权利要求之一所述的音频系统,还包括:

自适应噪声消除控制器(ANCC),其耦合到所述前馈麦克风(FF_MIC)和所述误差麦克风(FB_MIC),所述自适应噪声消除控制器(ANCC)配置为根据所述前馈信号(FF)和/或所述误差信号(ERR)执行噪声消除处理,以及

滤波器(FL),其耦合到所述前馈麦克风(FF_MIC)和所述扬声器(SP),所述滤波器具有由所述噪声消除处理确定的滤波器传递函数(F)。4.根据前述权利要求之一所述的音频系统,其中,所述噪声消除处理包括前馈噪声消除处理或反馈噪声消除处理或前馈噪声消除处理和反馈噪声消除处理两者。5.根据前述权利要求之一所述的音频系统,其中:

语音活动检测器过程确定以下语音活动状态之一:假、真或可能,

所述语音活动状态等于真,指示检测到语音,和

所述语音活动状态等于假,指示未检测到语音,和/或

所述语音活动检测器(VAD)根据所述语音活动状态控制所述自适应噪声消除控制器(ANCC)。6.根据前述权利要求之一所述的音频系统,其中,对所述自适应噪声消除控制器(ANCC)的控制包括:

在所述语音活动状态设置为真和/或可能的情况下,暂停噪声消除信号的自适应,以及

在所述语音活动状态设置为假的情况下,继续噪声消除信号的自适应。7.根据前述权利要求之一所述的音频系统,其中,在第一操作模式下,所述语音活动检测器(VAD)配置为:

分析所述前馈信号(FF)与所述误差信号(ERR)之间的相位差异,和

根据所分析的相位差异设置所述语音活动状态,和/或

当所述检测参数大于第一阈值时,进入所述第一操作模式。8.根据前述权利要求之一所述的音频系统,其中

将所分析的相位差异与预期的相位差异进行比较,以及

当所分析的相位差异小于所述预期的相位差异时,将所述语音活动状态设置为假,否则设置为真。9.根据前述权利要求之一所述的音频系统,其中,在第二操作模式下,所述语音活动检测器(VAD)配置为:

分析所述误差信号(ERR)的音调水平,和

根据所分析的音调水平设置所述语音活动状态,和/或

当所述检测参数小于第一阈值时,进入所述第二操作模式。10.根据前述权利要求之一所述的音频系统,其中

将所分析的音调水平与预期的音调水平进行比较,以及

当所分析的音调水平小于所述预期的音调水平时,将所述语音活动状态设置为假,否则设置为真。11.根据前述权利要求之一所述的音频系统,其中,在能够独立于前两种模式运行的第三操作模式下,所述语音活动检测器(VAD)配置为:

在第一时间段内监测所述检测参数,并将其表示为短期参数,在第二时间段内监测所述检测参数,并将其表示为长期参数,其中,所述第一时间段在时间上短于所述第二时间段,

组合所述短期参数和所述长期参数以得到组合的检测参数,以及

根据所述组合的检测参数设置所述语音活动状态。12.根据一项或更多项前述权利要求所述的音频系统,其中,在所述第三操作模式下:

所述短期参数和所述长期参数相当于能级,以及

当相对能级的改变超过第二阈值时,将语音活动状态设置为可能。13.根据一项或更多项前述权利要求所述的音频系统,其中,在第四操作模式下,所述语音活动检测器(VAD)配置为:

确定所述声音信号(MUS)是否是活动的,

如果没有声音信号(MUS)是活动的,则进入第一操作模式或第二操作模式,

如果所述声音信号(MUS)是活动的,并且如果所述检测参数小于第一阈值,则进入所述第二模式操作,或者

如果所述声音信号(MUS)是活动的,并且如果所述检测参数超过所述第一阈值,则进入组合的第一操作模式和第二操作模式。14.根据一项或更多项前述权利要求所述的音频系统,其中,在组合的第一操作模式和第二操作模式下,所述语音活动检测器(VAD)配置为:

分析所述误差信号(ERR)的音调水平并分析所述前馈信...

【专利技术属性】
技术研发人员:彼得
申请(专利权)人:AMS有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1