用于预测有噪声和/或增强的语音的可懂度的方法及双耳听力系统技术方案

技术编号：16608150 阅读：29 留言：0更新日期：2017-11-22 18:34

本申请公开了用于预测有噪声和/或增强的语音的可懂度的方法及双耳听力系统。本申请还公开了一种包括双耳语音可懂度预测单元的侵入双耳语音可懂度预测系统，所述双耳语音可懂度预测单元包括：第一、第二、第三和第四输入单元，用于分别提供目标信号的左和右无噪声版本及左和右有噪声和/或处理后版本的时频表示；第一和第二均衡‑抵消级，适于分别提供所得的无噪声信号及所得的有噪声和/或处理后的信号；‑单耳语音可懂度预测单元，用于提供最终双耳语音可懂度预测值SI测度；其中，第一和第二均衡‑抵消级适于优化最终双耳语音可懂度预测值SI测度以指明听者对目标信号的有噪声和/或处理后版本的最大可懂度。

全部详细技术资料下载

【技术实现步骤摘要】
用于预测有噪声和/或增强的语音的可懂度的方法及双耳听力系统
本申请涉及助听器的语音可懂度预测。本专利技术例如涉及用于预测有噪声和/或增强的(处理后的)语音的方法和系统及涉及实施前述方法的双耳听力系统。
技术介绍
助听器的设计通常受正常听力或听力受损人员参与的听音试验指导。这些听音测试用于调查新的听觉病矫治方案或信号处理技术的有用性。此外，它们用于在整个开发过程中确证和评估助听器对用户的好处。这些测试成本高且耗时。然而，目前尚没有实现前述试验的现实备选方案。
技术实现思路
在本申请中，提出了使用双耳侵入语音可懂度测度部分或完全代替使用听音试验，所述测度能够预测有噪声环境和助听器处理的影响。在语音可懂度测度的上下文中，术语“双耳”指人因结合来自左和右耳的信息获得的优势。在本说明书中，术语“侵入”意指为了计算语音可懂度测度，实现用于参考的纯净语音信号(没有噪声、失真或助听器处理)的取得。所提出的结构或方法的实施如图1D中所示。所述测度能够预测多种不同的听音条件(如不同的房间、不同位置或不同讲话者位置处的不同噪声类型)和处理类型(如不同的助听器或助听器设置/算法)的影响。所述测度依赖于信号，其通常可在测试助听器的环境中得到。具体地，所述测度基于四个输入信号：1)来自听者左耳的有噪声及可能助听器处理的语音信号。该信号可以是记录的信号、模拟的信号或“现场”信号(如在原位置拾取)；2)来自听者右耳的有噪声及可能助听器处理的语音信号。该信号可以是记录的信号、模拟的信号或“现场”信号(如在原位置拾取)；3)来自听者左耳的纯净语音信号。这应与有噪声/处理后的信号一样，但既没有噪声...
用于预测有噪声和/或增强的语音的可懂度的方法及双耳听力系统

【技术保护点】
一种侵入双耳语音可懂度预测系统，包括双耳语音可懂度预测单元，其适于接收包括a)左和右实质上无噪声版本xl,xr及b)左和右有噪声和/或处理后版本yl,yr中的语音的目标信号，所述信号被接收为声学信号或者为听者左和右耳处接收的声学信号的表示，所述双耳语音可懂度预测单元配置成将指明听者对目标信号的有噪声和/或处理后版本yl,yr的感知的最终双耳语音可懂度预测值SI测度提供为输出，所述双耳语音可懂度预测单元包括：‑第一和第二输入单元，用于分别提供目标信号的左无噪声版本xl和右无噪声版本xr的时频表示xl(k,m)和xr(k,m)，k为频率窗口指数，k＝1,2,...,K，m为时间指数；‑第三和第四输入单元，用于分别提供目标信号的左有噪声和/或处理后版本yl和右有噪声和/或处理后版本yr的时频表示yl(k,m)和yr(k,m)，k为频率窗口指数，k＝1,2,...,K，m为时间指数；‑第一均衡‑抵消级，适于分别接收和相对时移及振幅调节左和右无噪声版本xl(k,m)和xr(k,m)，随后使左和右目标信号的时移及振幅调节的左和右无噪声版本x’l(k,m)和x’r(k,m)彼此相减从而提供所得的无噪...

【技术特征摘要】
2016.03.15 EP 16160309.71.一种侵入双耳语音可懂度预测系统，包括双耳语音可懂度预测单元，其适于接收包括a)左和右实质上无噪声版本xl,xr及b)左和右有噪声和/或处理后版本yl,yr中的语音的目标信号，所述信号被接收为声学信号或者为听者左和右耳处接收的声学信号的表示，所述双耳语音可懂度预测单元配置成将指明听者对目标信号的有噪声和/或处理后版本yl,yr的感知的最终双耳语音可懂度预测值SI测度提供为输出，所述双耳语音可懂度预测单元包括：-第一和第二输入单元，用于分别提供目标信号的左无噪声版本xl和右无噪声版本xr的时频表示xl(k,m)和xr(k,m)，k为频率窗口指数，k＝1,2,...,K，m为时间指数；-第三和第四输入单元，用于分别提供目标信号的左有噪声和/或处理后版本yl和右有噪声和/或处理后版本yr的时频表示yl(k,m)和yr(k,m)，k为频率窗口指数，k＝1,2,...,K，m为时间指数；-第一均衡-抵消级，适于分别接收和相对时移及振幅调节左和右无噪声版本xl(k,m)和xr(k,m)，随后使左和右目标信号的时移及振幅调节的左和右无噪声版本x’l(k,m)和x’r(k,m)彼此相减从而提供所得的无噪声信号x(k,m)；-第二均衡-抵消级，适于分别接收和相对时移及振幅调节左和右有噪声和/或处理后版本yl(k,m)和yr(k,m)，随后使左和右目标信号的时移及振幅调节的左和右有噪声和/或处理后版本y’l(k,m)和y’r(k,m)彼此相减从而提供所得的有噪声和/或处理后的信号y(k,m)；及-单耳语音可懂度预测单元，用于基于所得的无噪声信号x(k,m)和所得的有噪声和/或处理后的信号y(k,m)提供最终双耳语音可懂度预测值SI测度；其中，第一和第二均衡-抵消级适于优化最终双耳语音可懂度预测值SI测度以指明听者对目标信号的有噪声和/或处理后版本yl,yr的最大可懂度。2.根据权利要求1所述的侵入双耳语音可懂度预测系统，配置成重复第一和第二均衡-抵消级和单耳语音可懂度预测单元进行的计算以优化最终双耳语音可懂度预测值从而指明听者对目标信号的所述有噪声和/或处理后版本的最大可懂度。3.根据权利要求1所述的侵入双耳语音可懂度预测系统，其中所述单耳语音可懂度预测单元包括：-第一包络提取单元，用于按时域包络的形式提供所得的无噪声信号x(k,m)或其函数的时频子频带表示从而提供时频子频带信号X(q,m)，q为子频带指数，q＝1,2,...,Q，m为时间指数；-第二包络提取单元，用于按时域包络的形式提供所得的有噪声和/或处理后的信号y(k,m)或其函数的时频子频带表示从而提供时频子频带信号Y(q,m)，q为子频带指数，q＝1,2,...,Q，m为时间指数；-第一时频段分开单元，用于将所得的无噪声信号x(k,m)的时频子频带表示X(q,m)分为对应于所述子频带信号的N个连续样本的时频包络段x(q,m)；-第二时频段分开单元，用于将有噪声和/或处理后的信号y(k,m)的时频子频带表示Y(q,m)分为对应于所述子频带信号的N个连续样本的时频包络段y(q,m)；-相关系数单元，适于计算无噪声信号的每一时频包络段和有噪声和/或处理后的信号的对应包络段之间的相关系数-最终语音可懂度测量单元，用于将最终双耳语音可懂度预测值SI测度提供为跨时间帧和子频带计算的相关系数的加权组合。4.根据权利要求1所述的侵入双耳语音可懂度预测系统，包括双耳听力损失模型。5.一种双耳听力系统，包括适于位于用户的左和右耳处的左和右助听器及根据权利要求1所述的侵入双耳语音可懂度预测系统。6.根据权利要求5所述的双耳听力系统，其中左和右助听器中的每一个包括：-左和右可配置的信号处理单元，配置成分别处理目标信号的左和右有噪声和/或处理后版本yl,yr及分别提供左和右处理后的信号uleft,uright；及-左和右输出单元，用于基于左和右电输出信号产生配置成可由用户感知为声音的输出刺激，所述电输出信号分别为左和右处理后的信号uleft,uright的形式或者源自其的信号；其中所述双耳听力系统包括：a)双耳听力损失模型单元，其操作地连接到所述侵入双耳语音可懂度预测单元并配置成将反映用户的相应左和右耳的听力受损的随频率而变的修改应用于电输出信号以向所述侵入双耳语音可懂度预测单元提供相应修改的电输出信号。7.根据权利要求5所述的双耳听力系统，其中左和右助听器中的每一个包括天线和收发器电路，用于在其间建立耳间链路以使能在其间交换包括音频和/或控制数据信号的数据。8.用于提供双耳语音可懂度预测值的方法，所述方法包括：S1，接收包括a)左和右实质上无噪声版本xl,xr及b)左和右有噪声和/或处理后版本yl,yr中的语音的目标信号，所述信号被接收为声学信号或者为听者左和右耳处接收的声学信号的表示；S2，分别提供目标信号的左无噪声版本xl和左有噪声和/或处理后版本yl的时频表示xl(k,m)和yl(k,m)，k为频率窗口指数，k＝1,2,...,K，m为时间指数；S3，分别提供目标信号的右无噪声版本xr和右有噪声和/或处理后版本yr的时频表示xr(k,m)和yr(k,m)，k为频率窗口指数，k＝1,2,...,K，m为时间...

【专利技术属性】
技术研发人员：A·H·安德森，J·M·德哈恩，郑华·谭，J·詹森，M·S·佩德森，
申请(专利权)人：奥迪康有限公司，
类型：发明
国别省市：丹麦,DK

全部详细技术资料下载我是这个专利的主人