用于耳戴式播放设备的语音活动检测的音频系统和信号处理方法技术方案

技术编号：32085995 阅读：18 留言：0更新日期：2022-01-29 18:07

一种用于耳戴式播放设备(HP)的音频系统，包括：扬声器(SP)、误差麦克风(FB_MIC)，其主要感测从扬声器(SP)输出的声音以及前馈麦克风(FF_MIC)，其主要感测周围环境声音。音频系统还包括语音活动检测器(VAD)，该语音活动检测器配置为记录来自前馈麦克风(FF_MIC)的前馈信号(FF)。此外，记录来自误差麦克风(FB_MIC)的误差信号(ERR)。根据前馈信号(FF)和误差信号(ERR)确定检测参数。监测检测参数并且根据检测参数设置语音活动状态。检测参数设置语音活动状态。检测参数设置语音活动状态。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于耳戴式播放设备的语音活动检测的音频系统和信号处理方法

[0001]本公开内容涉及用于耳戴式播放设备的语音活动检测的音频系统和信号处理方法，耳戴式播放设备例如包括扬声器、误差麦克风和前馈麦克风的耳机。

技术介绍

[0002]现今，越来越多的耳机或耳塞配备了噪声消除技术。例如，这种噪声消除技术被称为主动噪声消除或环境噪声消除，两者均缩写为ANC。ANC通常利用所记录的环境噪声进行处理以产生抗噪信号，然后将其与有用的音频信号进行组合，以通过耳机的扬声器播放。ANC也可以用于其他音频设备，例如手机或移动电话。各种ANC方法都使用反馈FB麦克风或误差麦克风、前馈FF麦克风或者反馈麦克风和前馈麦克风的组合。FF和FB ANC是通过基于音频系统的给定声学来调谐滤波器而实现的。
[0003]混合噪声消除耳机是众所周知的。例如，麦克风放置在直接耦合到耳鼓的空间内，通常靠近耳机驱动器的前部。这被称为反馈FB麦克风或误差麦克风。第二麦克风，即前馈FF麦克风，放置在耳机的外部，使得该第二麦克风与耳机驱动器声学上去耦。
[0004]常规环境噪声消除耳机的特点在于驱动器在其前后具有空气空间。前部空间部分地由佩戴耳机的用户的耳道空间构成。前部空间通常由覆盖有声学电阻器的通气口组成。后部空间的特点也通常在于具有声学电阻器的通气口。通常，前部空间通气口声学上耦合前部空间与后部空间。每个左右声道有两个麦克风。误差麦克风或反馈FB麦克风放置在靠近驱动器的位置，使得该误差麦克风或反馈FB麦克风检测来自驱动器的声音和来自周围环境的声音。前...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于耳戴式播放设备(HP)的音频系统，包括：
‑
扬声器(SP)，
‑
误差麦克风(FB_MIC)，其感测从所述扬声器输出的声音和周围环境声音(SP)，以及
‑
前馈麦克风(FF_MIC)，其主要感测周围环境声音，其中，所述音频系统包括语音活动检测器(VAD)，所述语音活动检测器配置为：
‑
记录来自所述前馈麦克风(FF_MIC)的前馈信号(FF)，
‑
记录来自所述误差麦克风(FB_MIC)的误差信号(ERR)，
‑
根据所述前馈信号(FF)和所述误差信号(ERR)确定至少一个检测参数，以及
‑
监测所述至少一个检测参数，并根据所述至少一个检测参数设置语音活动状态。2.根据前述权利要求所述的音频系统，其中，所述检测参数：
‑
基于所述前馈信号(FF)与所述误差信号(ERR)的比率，
‑
是所述误差信号与所述前馈信号之间的相位差异，或者
‑
还基于声音信号(MUS)。3.根据前述权利要求之一所述的音频系统，还包括：
‑
自适应噪声消除控制器(ANCC)，其耦合到所述前馈麦克风(FF_MIC)和所述误差麦克风(FB_MIC)，所述自适应噪声消除控制器(ANCC)配置为根据所述前馈信号(FF)和/或所述误差信号(ERR)执行噪声消除处理，以及
‑
滤波器(FL)，其耦合到所述前馈麦克风(FF_MIC)和所述扬声器(SP)，所述滤波器具有由所述噪声消除处理确定的滤波器传递函数(F)。4.根据前述权利要求之一所述的音频系统，其中，所述噪声消除处理包括前馈噪声消除处理或反馈噪声消除处理或前馈噪声消除处理和反馈噪声消除处理两者。5.根据前述权利要求之一所述的音频系统，其中：
‑
语音活动检测器过程确定以下语音活动状态之一：假、真或可能，
‑
所述语音活动状态等于真，指示检测到语音，和
‑
所述语音活动状态等于假，指示未检测到语音，和/或
‑
所述语音活动检测器(VAD)根据所述语音活动状态控制所述自适应噪声消除控制器(ANCC)。6.根据前述权利要求之一所述的音频系统，其中，对所述自适应噪声消除控制器(ANCC)的控制包括：
‑
在所述语音活动状态设置为真和/或可能的情况下，暂停噪声消除信号的自适应，以及
‑
在所述语音活动状态设置为假的情况下，继续噪声消除信号的自适应。7.根据前述权利要求之一所述的音频系统，其中，在第一操作模式下，所述语音活动检测器(VAD)配置为：
‑
分析所述前馈信号(FF)与所述误差信号(ERR)之间的相位差异，和
‑
根据所分析的相位差异设置所述语音活动状态，和/或
‑
当所述检测参数大于第一阈值时，进入所述第一操作模式。8.根据前述权利要求之一所述的音频系统，其中
‑
将所分析的相位差异与预期的相位差异进行比较，以及
‑
当所分析的相位差异小于所述预期的相位差异时，将所述语音活动状态设置为假，否则设置为真。9.根据前述权利要求之一所述的音频系统，其中，在第二操作模式下，所述语音活动检测器(VAD)配置为：
‑
分析所述误差信号(ERR)的音调水平，和
‑
根据所分析的音调水平设置所述语音活动状态，和/或
‑
当所述检测参数小于第一阈值时，进入所述第二操作模式。10.根据前述权利要求之一所述的音频系统，其中
‑
将所分析的音调水平与预期的音调水平进行比较，以及
‑
当所分析的音调水平小于所述预期的音调水平时，将所述语音活动状态设置为假，否则设置为真。11.根据前述权利要求之一所述的音频系统，其中，在能够独立于前两种模式运行的第三操作模式下，所述语音活动检测器(VAD)配置为：
‑
在第一时间段内监测所述检测参数，并将其表示为短期参数，在第二时间段内监测所述检测参数，并将其表示为长期参数，其中，所述第一时间段在时间上短于所述第二时间段，
‑
组合所述短期参数和所述长期参数以得到组合的检测参数，以及
‑
根据所述组合的检测参数设置所述语音活动状态。12.根据一项或更多项前述权利要求所述的音频系统，其中，在所述第三操作模式下：
‑
所述短期参数和所述长期参数相当于能级，以及
‑
当相对能级的改变超过第二阈值时，将语音活动状态设置为可能。13.根据一项或更多项前述权利要求所述的音频系统，其中，在第四操作模式下，所述语音活动检测器(VAD)配置为：
‑
确定所述声音信号(MUS)是否是活动的，
‑
如果没有声音信号(MUS)是活动的，则进入第一操作模式或第二操作模式，
‑
如果所述声音信号(MUS)是活动的，并且如果所述检测参数小于第一阈值，则进入所述第二模式操作，或者
‑
如果所述声音信号(MUS)是活动的，并且如果所述检测参数超过所述第一阈值，则进入组合的第一操作模式和第二操作模式。14.根据一项或更多项前述权利要求所述的音频系统，其中，在组合的第一操作模式和第二操作模式下，所述语音活动检测器(VAD)配置为：
‑
分析所述误差信号(ERR)的音调水平并分析所述前馈信...

【专利技术属性】
技术研发人员：彼得，
申请(专利权)人：AMS有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人