包括语音存在概率估计器的听力装置制造方法及图纸

技术编号:23215422 阅读:29 留言:0更新日期:2020-01-31 22:49
本申请公开了包括语音存在概率估计器的听力装置,所述听力装置包括:多个输入单元,每一输入单元按时频表示提供表示用户环境中的声音的电输入信号,其中所述声音为语音和附加噪声或其它失真的混合;多个波束形成器滤波单元,每一波束形成器滤波单元配置成接收多个电输入信号中的至少两个,所述多个波束形成器滤波单元中的每一个配置成提供表示用户周围的多个空间段的不同空间段中的声音的波束成形信号;多个语音概率估计器,每一语音概率估计器配置成接收特定空间段的波束成形信号并估计所述特定空间段在给定时间点和频率包含语音的概率;及其中所述多个语音概率估计器中的至少一个被实施为经训练的神经网络。

Hearing device including speech presence probability estimator

【技术实现步骤摘要】
包括语音存在概率估计器的听力装置
本专利技术涉及在听力装置如助听器中例如使用算法如神经网络进行语音存在概率估计。
技术介绍
用于SPP的单传声器算法是大多数语音处理算法中的关键组成部分,其中涉及有噪声的语音。这些算法试图基于有噪声的信号决定哪些时频区域语音为主及哪些时频区域噪声为主,或者,更一般地,它们估计每一时频区域中的语音存在概率。大量基于单传声器模型的SPP算法已在单传声器降噪的上下文中提出,例如参见[1]及其中的参考文献。这些算法趋于计算上简单及良好地工作,尤其在背景噪声静止/不波动时。最近,已提出用于单传声器SPP的基于深度学习的算法,例如参见[2]。这些算法通常将有噪声的幅度谱馈入深度神经网络(DNN),其被训练以估计哪些时频区域语音为主及哪些时频区域噪声为主。
技术实现思路
已提出用于语音存在概率(SPP)估计的、作为时间、频率和空间位置的函数的多传声器算法框架。在本申请中,公开了用于SPP估计的基于多传声器、深度学习的算法。所提出的算法不同于现有算法之处在于其结合了下述特征:a)其使用空间滤波(使用M≥2个传声器),导致比迄今提出的基于单传声器(M=1)的方法(例如参见[2])更好的性能;b)其使用有监督的学习(例如神经网络如深度神经网络(DNN))以避免在传统算法(例如参见[1])中进行的明确的(可能不太有效的)统计模型假设;及c)其依赖于理论上用于估计SPP的声音框架。与现有方法不同的是,所提出的算法在每一时频区域计算语音信号源自特定空间位置/方向的概率。一方面,提供一种听力装置如助听器。该听力装置包括多个(zN个)(例如zN≥2或3)波束形成器,其配置成从佩戴听力装置的用户周围环境的不同空间段(例如也称为卷(volume)或单元(cell))拾取声音并提供表示这些声音的相应波束成形信号。不同空间段中的每一空间段的(唯一适应的)语音存在概率(SPP)基于相应的波束成形信号提供。给定空间段的语音存在概率的估计例如基于神经网络(如深度神经网络(DNN))提供,例如基于包括给定空间部分的已知内容的波束成形信号的数据集进行训练。根据本专利技术的语音概率估计器的特别性质在于,每一空间单元均具有专用于其的SPP估计器。具体地,用于SPP估计器的与给定空间单元有关的一组给定优化参数(Ψ*ij)(例如神经网络的权重)已从朝向该特定空间单元的波束形成器处理(或提供)的训练数据产生。这通过专用于一个特定空间单元的SPP估计器在应用于另一空间单元时表现将不最佳的事实说明。因此,本解决方案相较将同一标准SPP应用于所有空间单元的解决方案(例如先前提及的单传声器解决方案)表现更好。听力装置在本申请的一方面,提供一种听力装置如助听器。该听力装置包括-多个输入单元,每一输入单元按时频表示提供表示用户环境中的声音的电输入信号,其中所述声音为语音和附加噪声或其它失真如混响的混合;-多个波束形成器滤波单元,每一波束形成器滤波单元配置成接收多个电输入信号中的至少两个如全部,所述多个波束形成器滤波单元中的每一个配置成提供表示用户周围的多个空间段如空间单元的不同空间段中的声音的波束成形信号。听力装置还包括:-多个语音概率估计器,每一语音概率估计器配置成接收特定空间段的波束成形信号并估计所述特定空间段在给定时间点和频率包含语音的概率;及其中所述多个语音概率估计器中的至少一个如全部被实施为经训练的神经网络如深度神经网络。从而可提供改进的语音存在概率估计器。听力装置可适于使得至少一输入单元包括:-输入变换器如传声器,用于提供表示环境中的声音的时域电输入信号;及-分析滤波器组,用于按时频表示提供电输入信号。输入单元例如可包括用于将模拟电输入信号提供为数字样本的模数转换器。听力装置可配置成由用户佩戴,例如佩戴在用户耳朵处或耳朵中(或者完全或部分植入在用户头部中)。每一波束形成器滤波单元可配置成提取源自多个空间段中的特定空间段如该空间段的中心位置的信号,同时最大程度地抑制源自其它位置的信号。优选地,给定波束形成器滤波单元聚焦于不同于所有其它波束形成器滤波单元的唯一空间段。听力装置可包括配置成实施合成波束形成器的合成波束形成器滤波单元,其为指向每一空间段如每一单元(θi,rj)的由多个波束形成器滤波单元提供的波束形成器的线性组合,其中,线性组合的系数从语音存在概率得到,及其中合成波束形成器滤波单元配置成提供合成波束成形信号。合成波束成形信号例如用于根据用户的需要(例如补偿听力受损)进一步处理,和/或作为可感知为声音的刺激呈现给听力装置的用户。线性组合的系数wres(k,l)例如通过下面的表达式给出:其中k和l分别为频率和时间指数,T为空间段的数量,及Pi(k,l)为第i个空间段的语音存在概率(假定等于估计的语音存在概率及wi(k,l)为指向第i个空间段的第i个波束形成器的波束形成器权重。听力装置可包括包含多个输入单元的单一听力装置或者可由前述单一听力装置构成。听力装置可由助听器、头戴式耳机、耳麦、耳朵保护装置或其组合构成或者包括助听器、头戴式耳机、耳麦、耳朵保护装置或其组合。听力装置可配置成使得多个语音概率估计器中的至少一个如全部实施为根据下面描述、具体实施方式中详述的及权利要求中限定的方法的经训练的神经网络。在实施例中,听力装置适于提供随频率而变的增益和/或随电平而变的压缩和/或一个或多个频率范围到一个或多个其它频率范围的移频(具有或没有频率压缩)以补偿用户的听力受损。在实施例中,听力装置包括用于增强输入信号并提供处理后的输出信号的信号处理器。在实施例中,听力装置包括输出单元,用于基于处理后的电信号提供由用户感知为声信号的刺激。在实施例中,输出单元包括耳蜗植入件的多个电极或者骨导听力装置的振动器。在实施例中,输出单元包括输出变换器。在实施例中,输出变换器包括用于将刺激作为声信号提供给用户的接收器(扬声器)。在实施例中,输出变换器包括用于将刺激作为颅骨的机械振动提供给用户的振动器(例如在附着到骨头的或骨锚式听力装置中)。在实施例中,听力装置包括用于提供表示声音的电输入信号的输入单元。在实施例中,输入单元包括输入变换器如传声器,用于将输入声音转换为电输入信号。在实施例中,输入单元包括用于接收包括声音的无线信号并提供表示所述声音的电输入信号的无线接收器。在实施例中,听力装置包括定向传声器系统,其适于对来自环境的声音进行空间滤波从而增强佩戴听力装置的用户的局部环境中的多个声源之中的目标声源。在实施例中,定向系统适于检测(如自适应检测)传声器信号的特定部分源自哪一方向。这可以例如现有技术中描述的多种不同方式实现。在听力装置中,传声器阵列波束形成器通常用于空间上衰减背景噪声源。许多波束形成器变型可在文献中找到。最小方差无失真响应(MVDR)波束形成器广泛用在传声器阵列信号处理中。理想地,MVDR波束形成器保持来自目标方向(也称为视向)的信号不变,而最大程度地衰减来自其它方向的声音信号。本文档来自技高网...

【技术保护点】
1.一种听力装置,配置成由用户佩戴,所述听力装置包括:/n-多个输入单元,每一输入单元按时频表示提供表示用户环境中的声音的电输入信号,其中所述声音为语音和附加噪声或其它失真的混合;/n-多个波束形成器滤波单元,每一波束形成器滤波单元配置成接收多个电输入信号中的至少两个,所述多个波束形成器滤波单元中的每一个配置成提供表示用户周围的多个空间段的不同空间段中的声音的波束成形信号;/n-多个语音概率估计器,每一语音概率估计器配置成接收特定空间段的波束成形信号并估计所述特定空间段在给定时间点和频率包含语音的概率;及其中/n所述多个语音概率估计器中的至少一个被实施为经训练的神经网络。/n

【技术特征摘要】
20180718 EP 18184230.31.一种听力装置,配置成由用户佩戴,所述听力装置包括:
-多个输入单元,每一输入单元按时频表示提供表示用户环境中的声音的电输入信号,其中所述声音为语音和附加噪声或其它失真的混合;
-多个波束形成器滤波单元,每一波束形成器滤波单元配置成接收多个电输入信号中的至少两个,所述多个波束形成器滤波单元中的每一个配置成提供表示用户周围的多个空间段的不同空间段中的声音的波束成形信号;
-多个语音概率估计器,每一语音概率估计器配置成接收特定空间段的波束成形信号并估计所述特定空间段在给定时间点和频率包含语音的概率;及其中
所述多个语音概率估计器中的至少一个被实施为经训练的神经网络。


2.根据权利要求1所述的听力装置,其中至少一输入单元包括:
-输入变换器,用于提供表示环境中的声音的时域电输入信号;及
-分析滤波器组,用于按时频表示提供电输入信号。


3.根据权利要求1或2所述的听力装置,其中每一波束形成器滤波单元配置成提取源自多个空间段中的特定空间段的信号,同时最大程度地抑制源自其它位置的信号。


4.根据权利要求1所述的听力装置,包括配置成实施合成波束形成器的合成波束形成器滤波单元,其为指向每一空间段(θi,rj)的由多个波束形成器滤波单元提供的波束形成器的线性组合,其中,线性组合的系数从语音存在概率得到,及其中合成波束形成器滤波单元配置成提供合成波束成形信号。


5.根据权利要求1所述的听力装置,其中用户周围的所述多个空间段包括包含用户嘴巴周围的段的自我话音段以使能估计听力装置用户的语音存在概率。


6.根据权利要求1所述的听力装置,包括包含所述多个输入单元的单一听力装置或由该听力装置构成。


7.根据权利要求1所述的听力装置,由助听器、头戴式耳机、耳麦、耳朵保护装置或其组合构成或者包括助听器、头戴式耳机、耳麦、耳朵保护装置或其组合。


8.根据权利要求1所述的听力装置,其中所述多个语音存在概率估计器中的至少一个实施为根据权利要求10所述的方法训练的神经网络。


9.一种听力系统,包括第一和第二根据权利要求1所述的听力装置,每一听力装置包括天线和收发器电路,配置成在其间建立通信链路,及每一听力装置包括多个输入单元中的至少一个。


10.在听力装置中提供包括语音和附加噪声或其它失真的声音信号的语音存在概率的估计量的方法,听力装置包括多个输入单元,每一输入单元按时频表示(k,l)提供表示所述声音信号的电输入信号,所述方法包括:
-按多个空间段(i,j)提供用户周围空间的细分;
-提供语音存在指示函数,对于给定电输入信号,其指明在给定频率和时间(k,l)、在给定空间段(i,j)中是否或者以何种程度存...

【专利技术属性】
技术研发人员:J·詹森
申请(专利权)人:奥迪康有限公司
类型:发明
国别省市:丹麦;DK

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1