用于预测有噪声和/或增强的语音的可懂度的方法及双耳听力系统技术方案

技术编号:16608150 阅读:29 留言:0更新日期:2017-11-22 18:34
本申请公开了用于预测有噪声和/或增强的语音的可懂度的方法及双耳听力系统。本申请还公开了一种包括双耳语音可懂度预测单元的侵入双耳语音可懂度预测系统,所述双耳语音可懂度预测单元包括:第一、第二、第三和第四输入单元,用于分别提供目标信号的左和右无噪声版本及左和右有噪声和/或处理后版本的时频表示;第一和第二均衡‑抵消级,适于分别提供所得的无噪声信号及所得的有噪声和/或处理后的信号;‑单耳语音可懂度预测单元,用于提供最终双耳语音可懂度预测值SI测度;其中,第一和第二均衡‑抵消级适于优化最终双耳语音可懂度预测值SI测度以指明听者对目标信号的有噪声和/或处理后版本的最大可懂度。

【技术实现步骤摘要】
用于预测有噪声和/或增强的语音的可懂度的方法及双耳听力系统
本申请涉及助听器的语音可懂度预测。本专利技术例如涉及用于预测有噪声和/或增强的(处理后的)语音的方法和系统及涉及实施前述方法的双耳听力系统。
技术介绍
助听器的设计通常受正常听力或听力受损人员参与的听音试验指导。这些听音测试用于调查新的听觉病矫治方案或信号处理技术的有用性。此外,它们用于在整个开发过程中确证和评估助听器对用户的好处。这些测试成本高且耗时。然而,目前尚没有实现前述试验的现实备选方案。
技术实现思路
在本申请中,提出了使用双耳侵入语音可懂度测度部分或完全代替使用听音试验,所述测度能够预测有噪声环境和助听器处理的影响。在语音可懂度测度的上下文中,术语“双耳”指人因结合来自左和右耳的信息获得的优势。在本说明书中,术语“侵入”意指为了计算语音可懂度测度,实现用于参考的纯净语音信号(没有噪声、失真或助听器处理)的取得。所提出的结构或方法的实施如图1D中所示。所述测度能够预测多种不同的听音条件(如不同的房间、不同位置或不同讲话者位置处的不同噪声类型)和处理类型(如不同的助听器或助听器设置/算法)的影响。所述测度依赖于信号,其通常可在测试助听器的环境中得到。具体地,所述测度基于四个输入信号:1)来自听者左耳的有噪声及可能助听器处理的语音信号。该信号可以是记录的信号、模拟的信号或“现场”信号(如在原位置拾取);2)来自听者右耳的有噪声及可能助听器处理的语音信号。该信号可以是记录的信号、模拟的信号或“现场”信号(如在原位置拾取);3)来自听者左耳的纯净语音信号。这应与有噪声/处理后的信号一样,但既没有噪声也没有助听器处理;4)来自听者右耳的纯净语音信号。这应与有噪声/处理后的信号一样,但既没有噪声也没有助听器处理;从这四个输入信号,所述测度提供一数,其描述由一组具有类似听音能力的听者判断平均起来(或者由特定用户判断)有噪声/处理后的信号怎样明白易懂。输出可以是简单的“得分”形式(如0和1之间的数,其中0为难懂,1为高度明白易懂)或者听音测试结果的直接预测的形式(如话语的一部分被正确理解、语音接受阈和/或类似)。该方法在[Andersenetal.;2016]中详细描述。具体地,提出用图1D中所示的结构或方法解决上述任务。所有四个信号(或作为备选,仅两个有噪声/处理后的信号)可以也可不首先遭受第一模型(图1D中的听力损失模型),其通过向信号添加噪声和失真以使模型预测拟合具有特定听力损失的受测对象的表现而仿效听力损失(或与正常听力的偏差)。存在几个这样的模型,但听力损失模型的特别简单的例子为向输入信号添加根据所涉及听力损失谱整形的统计上独立的噪声。之后,第二模型(图1D中的双耳优势(advantage))用于对具有两只耳朵的受测对象的优势建模。该模型将左和右耳信号结合为单一纯净信号和单一有噪声/处理后的信号。这个过程需要确定左和右耳信号怎样进行结合的一个或多个参数,如左和右耳处接收的信号之间的电平差和/或时间差。之后,单一纯净信号和单一有噪声/处理后的信号发送给单耳可懂度测度(图1D中的“单耳可懂度测度”),其不考虑双耳优势。术语“单耳”用于表明(尽管来自左和右耳的信号组合为所得的信号)一个所得的(组合)信号通过(单耳)语音可懂度预测单元仿效。“单耳语音可懂度预测单元”基于对应的所得的实质上无噪声及有噪声/处理后的目标信号(就像它们源自单耳设置一样,例如参见图1D)评估语音可懂度。作为备选,可使用其它术语如“通道语音可懂度预测单元”或简单的“语音可懂度预测单元”。其提供可懂度测度。确定结合左和右耳信号的过程所需要的参数使得所得的语音可懂度测度最大化。所提出的结构使双耳优势的任何模型能与用于处理后的信号的(如单耳或双耳)语音可懂度的任何模型一起使用并获得双耳可懂度测度,其处理处理后的信号。本专利技术的实施具有计算简单的优点因而很适合在功率受限的情形下使用,如在助听器中使用。双耳语音可懂度系统在本申请的一方面,提供侵入双耳语音可懂度预测系统。该双耳语音可懂度预测系统包括双耳语音可懂度预测单元,其适于接收包括a)左和右实质上无噪声版本xl,xr及b)左和右有噪声和/或处理后版本yl,yr的语音的目标信号,所述信号被接收为声学信号或者为听者左和右耳处接收的声学信号的表示,该双耳语音可懂度预测单元配置成将指明听者对目标信号的有噪声和/或处理后版本yl,yr的感知的最终双耳语音可懂度预测值SI测度提供为输出。该双耳语音可懂度预测单元还包括:-第一和第二输入单元,用于分别提供目标信号的左无噪声版本xl和有噪声和/或处理后版本yl的时频表示xl(k,m)和yl(k,m),k为频率窗口(bin)指数,k=1,2,…,K,m为时间指数;-第三和第四输入单元,用于分别提供目标信号的右无噪声版本xr和有噪声和/或处理后版本yr的时频表示xr(k,m)和yr(k,m),k为频率窗口指数,k=1,2,…,K,m为时间指数;-第一均衡-抵消级,适于分别接收和相对时移及振幅调节左和右无噪声版本xl(k,m)和xr(k,m),随后使左和右目标信号的时移及振幅调节的左和右无噪声版本xl’(k,m)和xr’(k,m)彼此相减从而提供所得的无噪声信号x(k,m);-第二均衡-抵消级,适于分别接收和相对时移及振幅调节左和右有噪声和/或处理后版本yl(k,m)和yr(k,m),随后使左和右目标信号的时移及振幅调节的左和右有噪声和/或处理后版本yl’(k,m)和yr’(k,m)彼此相减从而提供所得的有噪声和/或处理后的信号y(k,m);及-单耳语音可懂度预测单元,用于基于所得的无噪声信号x(k,m)和所得的有噪声和/或处理后的信号y(k,m)提供最终双耳语音可懂度预测值SI测度;其中第一和第二均衡-抵消级适于优化最终双耳语音可懂度预测值SI测度以指明听者对目标信号的有噪声和/或处理后版本yl,yr的最大可懂度。从而,可提供改进的语音可懂度预测器。在实施例中,该侵入双耳语音可懂度预测系统如第一和第二均衡-抵消级和单耳语音可懂度预测单元配置成重复相应单元进行的计算以优化最终双耳语音可懂度预测值从而指明听者对目标信号的所述有噪声和/或处理后版本的最大可懂度。在实施例中,第一和第二均衡-抵消级和单耳语音可懂度预测单元配置成分别针对左和右无噪声版本xl(k,m)和xr(k,m)及左和右有噪声和/或处理后版本yl(k,m)和yr(k,m)的不同时移及振幅调节重复相应单元进行的计算以优化最终双耳语音可懂度预测值从而指明听者对目标信号的所述有噪声和/或处理后版本的最大可懂度。在实施例中,第一和第二均衡-抵消级配置成对时移和振幅调节的所有组合进行相应的穷尽计算,例如对于一组离散的值,例如在相应现实范围内。在实施例中,第一和第二均衡-抵消级配置成使用其它方案(如算法)估计最终双耳语音可懂度预测值(SI测度)的最佳值,例如基于最速下降或梯度的算法。在实施例中,单耳语音可懂度预测单元包括:-第一包络提取单元,用于按时域包络的形式提供所得的无噪声信号x(k,m)或其函数的时频子频带表示从而提供时频子频带信号X(q,m),q为子频带指数,q=1,2,…,Q,m为时间指数;-第二包络提取单元,用于按时域包络的形式提供所得的本文档来自技高网...
用于预测有噪声和/或增强的语音的可懂度的方法及双耳听力系统

【技术保护点】
一种侵入双耳语音可懂度预测系统,包括双耳语音可懂度预测单元,其适于接收包括a)左和右实质上无噪声版本xl,xr及b)左和右有噪声和/或处理后版本yl,yr中的语音的目标信号,所述信号被接收为声学信号或者为听者左和右耳处接收的声学信号的表示,所述双耳语音可懂度预测单元配置成将指明听者对目标信号的有噪声和/或处理后版本yl,yr的感知的最终双耳语音可懂度预测值SI测度提供为输出,所述双耳语音可懂度预测单元包括:‑第一和第二输入单元,用于分别提供目标信号的左无噪声版本xl和右无噪声版本xr的时频表示xl(k,m)和xr(k,m),k为频率窗口指数,k=1,2,...,K,m为时间指数;‑第三和第四输入单元,用于分别提供目标信号的左有噪声和/或处理后版本yl和右有噪声和/或处理后版本yr的时频表示yl(k,m)和yr(k,m),k为频率窗口指数,k=1,2,...,K,m为时间指数;‑第一均衡‑抵消级,适于分别接收和相对时移及振幅调节左和右无噪声版本xl(k,m)和xr(k,m),随后使左和右目标信号的时移及振幅调节的左和右无噪声版本x’l(k,m)和x’r(k,m)彼此相减从而提供所得的无噪声信号x(k,m);‑第二均衡‑抵消级,适于分别接收和相对时移及振幅调节左和右有噪声和/或处理后版本yl(k,m)和yr(k,m),随后使左和右目标信号的时移及振幅调节的左和右有噪声和/或处理后版本y’l(k,m)和y’r(k,m)彼此相减从而提供所得的有噪声和/或处理后的信号y(k,m);及‑单耳语音可懂度预测单元,用于基于所得的无噪声信号x(k,m)和所得的有噪声和/或处理后的信号y(k,m)提供最终双耳语音可懂度预测值SI测度;其中,第一和第二均衡‑抵消级适于优化最终双耳语音可懂度预测值SI测度以指明听者对目标信号的有噪声和/或处理后版本yl,yr的最大可懂度。...

【技术特征摘要】
2016.03.15 EP 16160309.71.一种侵入双耳语音可懂度预测系统,包括双耳语音可懂度预测单元,其适于接收包括a)左和右实质上无噪声版本xl,xr及b)左和右有噪声和/或处理后版本yl,yr中的语音的目标信号,所述信号被接收为声学信号或者为听者左和右耳处接收的声学信号的表示,所述双耳语音可懂度预测单元配置成将指明听者对目标信号的有噪声和/或处理后版本yl,yr的感知的最终双耳语音可懂度预测值SI测度提供为输出,所述双耳语音可懂度预测单元包括:-第一和第二输入单元,用于分别提供目标信号的左无噪声版本xl和右无噪声版本xr的时频表示xl(k,m)和xr(k,m),k为频率窗口指数,k=1,2,...,K,m为时间指数;-第三和第四输入单元,用于分别提供目标信号的左有噪声和/或处理后版本yl和右有噪声和/或处理后版本yr的时频表示yl(k,m)和yr(k,m),k为频率窗口指数,k=1,2,...,K,m为时间指数;-第一均衡-抵消级,适于分别接收和相对时移及振幅调节左和右无噪声版本xl(k,m)和xr(k,m),随后使左和右目标信号的时移及振幅调节的左和右无噪声版本x’l(k,m)和x’r(k,m)彼此相减从而提供所得的无噪声信号x(k,m);-第二均衡-抵消级,适于分别接收和相对时移及振幅调节左和右有噪声和/或处理后版本yl(k,m)和yr(k,m),随后使左和右目标信号的时移及振幅调节的左和右有噪声和/或处理后版本y’l(k,m)和y’r(k,m)彼此相减从而提供所得的有噪声和/或处理后的信号y(k,m);及-单耳语音可懂度预测单元,用于基于所得的无噪声信号x(k,m)和所得的有噪声和/或处理后的信号y(k,m)提供最终双耳语音可懂度预测值SI测度;其中,第一和第二均衡-抵消级适于优化最终双耳语音可懂度预测值SI测度以指明听者对目标信号的有噪声和/或处理后版本yl,yr的最大可懂度。2.根据权利要求1所述的侵入双耳语音可懂度预测系统,配置成重复第一和第二均衡-抵消级和单耳语音可懂度预测单元进行的计算以优化最终双耳语音可懂度预测值从而指明听者对目标信号的所述有噪声和/或处理后版本的最大可懂度。3.根据权利要求1所述的侵入双耳语音可懂度预测系统,其中所述单耳语音可懂度预测单元包括:-第一包络提取单元,用于按时域包络的形式提供所得的无噪声信号x(k,m)或其函数的时频子频带表示从而提供时频子频带信号X(q,m),q为子频带指数,q=1,2,...,Q,m为时间指数;-第二包络提取单元,用于按时域包络的形式提供所得的有噪声和/或处理后的信号y(k,m)或其函数的时频子频带表示从而提供时频子频带信号Y(q,m),q为子频带指数,q=1,2,...,Q,m为时间指数;-第一时频段分开单元,用于将所得的无噪声信号x(k,m)的时频子频带表示X(q,m)分为对应于所述子频带信号的N个连续样本的时频包络段x(q,m);-第二时频段分开单元,用于将有噪声和/或处理后的信号y(k,m)的时频子频带表示Y(q,m)分为对应于所述子频带信号的N个连续样本的时频包络段y(q,m);-相关系数单元,适于计算无噪声信号的每一时频包络段和有噪声和/或处理后的信号的对应包络段之间的相关系数-最终语音可懂度测量单元,用于将最终双耳语音可懂度预测值SI测度提供为跨时间帧和子频带计算的相关系数的加权组合。4.根据权利要求1所述的侵入双耳语音可懂度预测系统,包括双耳听力损失模型。5.一种双耳听力系统,包括适于位于用户的左和右耳处的左和右助听器及根据权利要求1所述的侵入双耳语音可懂度预测系统。6.根据权利要求5所述的双耳听力系统,其中左和右助听器中的每一个包括:-左和右可配置的信号处理单元,配置成分别处理目标信号的左和右有噪声和/或处理后版本yl,yr及分别提供左和右处理后的信号uleft,uright;及-左和右输出单元,用于基于左和右电输出信号产生配置成可由用户感知为声音的输出刺激,所述电输出信号分别为左和右处理后的信号uleft,uright的形式或者源自其的信号;其中所述双耳听力系统包括:a)双耳听力损失模型单元,其操作地连接到所述侵入双耳语音可懂度预测单元并配置成将反映用户的相应左和右耳的听力受损的随频率而变的修改应用于电输出信号以向所述侵入双耳语音可懂度预测单元提供相应修改的电输出信号。7.根据权利要求5所述的双耳听力系统,其中左和右助听器中的每一个包括天线和收发器电路,用于在其间建立耳间链路以使能在其间交换包括音频和/或控制数据信号的数据。8.用于提供双耳语音可懂度预测值的方法,所述方法包括:S1,接收包括a)左和右实质上无噪声版本xl,xr及b)左和右有噪声和/或处理后版本yl,yr中的语音的目标信号,所述信号被接收为声学信号或者为听者左和右耳处接收的声学信号的表示;S2,分别提供目标信号的左无噪声版本xl和左有噪声和/或处理后版本yl的时频表示xl(k,m)和yl(k,m),k为频率窗口指数,k=1,2,...,K,m为时间指数;S3,分别提供目标信号的右无噪声版本xr和右有噪声和/或处理后版本yr的时频表示xr(k,m)和yr(k,m),k为频率窗口指数,k=1,2,...,K,m为时间...

【专利技术属性】
技术研发人员:A·H·安德森J·M·德哈恩郑华·谭J·詹森M·S·佩德森
申请(专利权)人:奥迪康有限公司
类型:发明
国别省市:丹麦,DK

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1