单耳侵入语音可懂度预测单元、助听器及双耳助听器系统技术方案

技术编号:16178166 阅读:32 留言:0更新日期:2017-09-09 05:42
本申请公开了单耳侵入语音可懂度预测单元、助听器及双耳助听器系统,其中所述单耳语音可懂度预测单元包括:第一和第二输入单元,用于分别提供目标信号的无噪声版本s和有噪声和/或处理后版本x的时频表示s(k,m)和x(k,m);第一和第二包络提取单元,用于分别提供目标信号的无噪声版本s和有噪声和/或处理后版本x的时频子频带表示sj(m)和xj(m);第一和第二时频段分开单元,用于将时频子频带表示sj(m)和xj(m)分为时频段Sm和Xm;规格化和变换单元,配置成提供时频段Sm和Xm的行及列的至少一规格化和/或变换运算;中间语音可懂度计算单元,适于提供估计所述时频段Xm的可懂度的中间语音可懂度系数dm;最终单耳语音可懂度计算单元,用于计算最终单耳语音可懂度预测值d。

【技术实现步骤摘要】
单耳侵入语音可懂度预测单元、助听器及双耳助听器系统
本申请涉及助听器或助听器系统领域。
技术介绍
对于例如因噪声或回响而失真及可能已通过一些信号处理装置如助听器的语音信号,其可懂度降低。因此,需要预测这样的语音信号的可懂度的解决方案以便采取相应措施提高用户的听音质量。
技术实现思路
本专利技术涉及基于目标信号分量的实质上无噪声(“纯净”)版本的同时了解进行包括目标信号分量的有噪声/处理后的语音信号的单耳侵入可懂度预测。本专利技术还涉及包括单耳侵入可懂度预测单元的助听器;及涉及包括第一和第二助听器的双耳助听器系统,每一助听器包括单耳侵入可懂度预测单元,其中该双耳助听器系统配置成建立使能在第一和第二助听器之间交换单耳语音可懂度预测值或源自其的信息的无线链路。单耳语音可懂度预测单元在本申请的一方面,提供单耳语音可懂度预测单元,其适于接收包括语音的目标信号的实质上无噪声版本s和有噪声和/或处理后版本x,该单耳语音可懂度预测单元配置成将最终单耳语音可懂度预测值d提供为输出,其指明听者对目标信号的有噪声和/或处理后版本x的感知,该单耳语音可懂度预测单元包括:a)第一输入单元,用于提供目标信号的无噪声版本s的时频表示s(k,m),k为频率窗口(bin)指数,k=1,2,…,K,及m为时间指数;b)第二输入单元,用于提供目标信号的有噪声和/或处理后版本x的时频表示x(k,m),k为频率窗口(bin)指数,k=1,2,…,K,及m为时间指数;c)第一包络提取单元,用于提供目标信号的无噪声版本s的时频子频带表示sj(m),其表示无噪声目标信号的子频带信号sj(m)的时域包络或其函数,j为子频带指数,j=1,2,…,J,m为时间指数;d)第二包络提取单元,用于提供目标信号的有噪声和/或处理后版本x的时频子频带表示xj(m),其表示目标信号的有噪声和/或处理后版本的子频带信号xj(m)的时域包络或其函数,j为子频带指数,j=1,2,…,J,及m为时间指数;e)第一时频段分开单元,用于将目标信号的无噪声版本s的时频子频带表示sj(m)分为对应于子频带信号的N个连续样本的时频段Sm;f)第二时频段分开单元,用于将目标信号的有噪声和/或处理后版本x的时频子频带表示xj(m)分为对应于子频带信号的N个连续样本的时频段Xm;g)中间语音可懂度计算单元,适于提供估计所述时频段Xm的可懂度的中间语音可懂度系数dm,所述中间语音可懂度系数dm基于实质上无噪声的(非必须地,规格化和/或变换的)时频段及基于有噪声和/或处理后的(非必须地,规格化和/或变换的)时频段h)最终单耳语音可懂度计算单元,用于计算估计目标信号的有噪声和/或处理后版本x的可懂度的最终单耳语音可懂度预测值d,其通过随时间组合所述中间语音可懂度系数dm或其变换版本进行。在实施例中,单耳语音可懂度预测单元包括规格化和变换单元,适于提供所述时频段Xm(Sm)的规格化和/或变换版本在实施例中,规格化和变换单元配置成将一个或多个行和/或列规格化和/或变换运算算法应用于时频段Sm和/或Xm。在实施例中,规格化和变换单元配置成提供时频段Sm和/或Xm的行的至少一规格化和/或变换运算及列的至少一规格化和/或变换运算。在实施例中,单耳语音可懂度预测单元包括规格化和变换单元,其配置成提供时频段Sm和Xm的行和列的规格化和/或变换,其中行的规格化和/或变换包括至少一下述运算:R1)行的均值规格化(参见下面的行规格化g1);R2)行的单位范数规格化(参见下面的行规格化g2);R3)行的傅里叶变换(参见下面的行变换g3);R4)提供行的傅里叶量值谱(参见下面的行变换g4);及R5)提供恒等运算(参见下面的行变换g5);及其中列的规格化和/或变换包括至少一下述运算:C1)列的均值规格化(参见下面的列规格化h1);及C2)列的单位范数规格化(参见下面的列规格化h2)。在实施例中,最终单耳语音可懂度计算单元配置成通过随时间求平均或者通过将MIN或MAX函数或其它代数或统计函数应用于中间语音可懂度系数dm或其变换版本而组合所述中间语音可懂度系数dm。在实施例中,第一和第二输入单元配置成将目标信号的无噪声版本s(也称为“纯净目标信号(目标信号的纯净版)”)和目标信号的有噪声和/或处理后版本x(称为“信息信号x”)分别接收为时变(时域/全带)信号s(n)和x(n),n为时间指数。在实施例中,第一和第二输入单元配置成从另一单元或装置分别接收纯净目标信号s和信息信号x,分别为时频表示s(k,m)和x(k,m),k和m分别为频率和时间指数。在实施例中,第一和第二输入单元中的每一个包括频率分解单元,用于从相应信号(s(n)和x(n),n为时间指数)的时域版提供纯净目标信号s和信息信号x的时频表示s(k,m)和x(k,m)。在实施例中,频率分解单元包括带通滤波器组(如γ音滤波器组),或者适于实施傅里叶变换算法(如短时傅里叶变换(STFT)算法)。在实施例中,单耳语音可懂度预测单元包括话音活动检测单元,用于指明目标信号的实质上无噪声的版本s及有噪声和/或处理后的版本x的特定时段是否或者何种程度地包括语音或估计包括语音,及提供指明该结果的话音活动控制信号。在实施例中,话音活动检测单元配置成提供二元指示,其识别包括语音或不包括语音的段。在实施例中,话音活动检测单元配置成识别具有某一概率包括语音的段。在实施例中,话音活动检测单元适用于时域信号(或全带信号s(n),x(n),n为时间指数)。在实施例中,话音活动检测单元适用于信号(s(k,m),x(k,m),或sj(m),xj(m),k和j为频率指数(分别对应于窗口和子频带),m为时间指数)或源自其的信号的时频表示。在实施例中,话音活动检测单元配置成基于时频单元电平(或例如在子频带信号xj(m)中)识别包括语音的时频段。在实施例中,单耳语音可懂度预测单元适于从另一单元或装置接收(如无线接收)话音活动控制信号。在实施例中,单耳语音可懂度预测单元包括话音活动检测单元,用于分别识别目标信号的实质上无噪声版本s和有噪声和/或处理后版本x的包括或者估计包括语音的时段,及其中单耳语音可懂度预测单元配置成分别提供目标信号的实质上无噪声版本s和有噪声和/或处理后版本x的修改版本,其仅包括前述包括或估计包括语音的时段。在实施例中,第一和第二时频段分开单元配置成使时频段Sm和Xm或其规格化和/或变换版本和的产生基于话音活动控制信号,例如根据话音活动控制信号产生所述时频段,例如仅在指明存在语音时或者在所涉及时频段包含语音的概率大于预定值如0.5时。在实施例中,单耳语音可懂度预测单元包括听力损失模型单元,配置成应用目标信号的有噪声和/或处理后版本x的随频率而变的修改,从而反映听者的相应耳朵与正常听力之间的偏差如听力受损,进而提供目标信号的修改后的有噪声和/或处理后版本x以与目标信号的实质上无噪声版本s一起用作计算最终单耳语音可懂度预测值d的基础。在实施例中,听力损失模型单元配置成添加统计上独立的噪声信号,其根据听者的相应耳朵的听力图、目标信号的有噪声和/或处理后版本x进行谱整形。第一和第二包络提取单元配置成分别从纯净目标信号s和信息信号x的时频表示s(k,m)和x(k,m)提取纯净目标信号s和信息信号x的本文档来自技高网...
单耳侵入语音可懂度预测单元、助听器及双耳助听器系统

【技术保护点】
单耳语音可懂度预测单元,适于接收包括语音的目标信号的实质上无噪声版本s和有噪声和/或处理后版本x,所述单耳语音可懂度预测单元配置成将最终单耳语音可懂度预测值d提供为输出,所述预测值指明听者对目标信号的有噪声和/或处理后版本x的感知,所述单耳语音可懂度预测单元包括:‑第一输入单元,用于提供目标信号的无噪声版本s的时频表示s(k,m),k为频率窗口指数,k=1,2,…,K,及m为时间指数;‑第二输入单元,用于提供目标信号的有噪声和/或处理后版本x的时频表示x(k,m),k为频率窗口指数,k=1,2,…,K,及m为时间指数;‑第一包络提取单元,用于提供目标信号的无噪声版本s的时频子频带表示sj(m),其表示无噪声目标信号的子频带信号sj(m)的时域包络或其函数,j为子频带指数,j=1,2,…,J,m为时间指数;‑第二包络提取单元,用于提供目标信号的有噪声和/或处理后版本x的时频子频带表示xj(m),其表示目标信号的有噪声和/或处理后版本的子频带信号xj(m)的时域包络或其函数,j为子频带指数,j=1,2,…,J,及m为时间指数;‑第一时频段分开单元,用于将目标信号的无噪声版本s的时频子频带表示sj(m)分为对应于子频带信号的N个连续样本的时频段Sm;‑第二时频段分开单元,用于将目标信号的有噪声和/或处理后版本x的时频子频带表示xj(m)分为对应于子频带信号的N个连续样本的时频段Xm;‑规格化和变换单元,配置成提供时频段Sm和Xm的行的至少一规格化和/或变换运算及列的至少一规格化和/或变换运算;‑中间语音可懂度计算单元,适于提供估计所述时频段Xm的可懂度的中间语音可懂度系数dm,所述中间语音可懂度系数dm基于实质上无噪声的、规格化和/或变换的时频段...

【技术特征摘要】
2016.03.01 EP 16157993.31.单耳语音可懂度预测单元,适于接收包括语音的目标信号的实质上无噪声版本s和有噪声和/或处理后版本x,所述单耳语音可懂度预测单元配置成将最终单耳语音可懂度预测值d提供为输出,所述预测值指明听者对目标信号的有噪声和/或处理后版本x的感知,所述单耳语音可懂度预测单元包括:-第一输入单元,用于提供目标信号的无噪声版本s的时频表示s(k,m),k为频率窗口指数,k=1,2,…,K,及m为时间指数;-第二输入单元,用于提供目标信号的有噪声和/或处理后版本x的时频表示x(k,m),k为频率窗口指数,k=1,2,…,K,及m为时间指数;-第一包络提取单元,用于提供目标信号的无噪声版本s的时频子频带表示sj(m),其表示无噪声目标信号的子频带信号sj(m)的时域包络或其函数,j为子频带指数,j=1,2,…,J,m为时间指数;-第二包络提取单元,用于提供目标信号的有噪声和/或处理后版本x的时频子频带表示xj(m),其表示目标信号的有噪声和/或处理后版本的子频带信号xj(m)的时域包络或其函数,j为子频带指数,j=1,2,…,J,及m为时间指数;-第一时频段分开单元,用于将目标信号的无噪声版本s的时频子频带表示sj(m)分为对应于子频带信号的N个连续样本的时频段Sm;-第二时频段分开单元,用于将目标信号的有噪声和/或处理后版本x的时频子频带表示xj(m)分为对应于子频带信号的N个连续样本的时频段Xm;-规格化和变换单元,配置成提供时频段Sm和Xm的行的至少一规格化和/或变换运算及列的至少一规格化和/或变换运算;-中间语音可懂度计算单元,适于提供估计所述时频段Xm的可懂度的中间语音可懂度系数dm,所述中间语音可懂度系数dm基于实质上无噪声的、规格化和/或变换的时频段及基于有噪声和/或处理后的、规格化和/或变换的时频段-最终单耳语音可懂度计算单元,用于计算估计目标信号的有噪声和/或处理后版本x的可懂度的最终单耳语音可懂度预测值d,其通过随时间组合所述中间语音可懂度系数dm或其变换版本进行。2.根据权利要求1所述的单耳语音可懂度预测单元,包括话音活动检测单元,用于指明目标信号的实质上无噪声的版本s及有噪声和/或处理后的版本x的特定时段是否或者何种程度地包括语音或估计包括语音,及提供指明该结果的话音活动控制信号。3.根据权利要求1或2所述的单耳语音可懂度预测单元,包括话音活动检测单元,用于分别识别目标信号的实质上无噪声版本s和有噪声和/或处理后版本x的包括或者估计包括语音的时段,及其中所述单耳语音可懂度预测单元配置成分别提供目标信号的实质上无噪声版本s和有噪声和/或处理后版本x的修改版本,所述修改版本仅包括前述包括或估计包括语音的时段。4.根据权利要求1所述的单耳语音可懂度预测单元,包括听力损失模型单元,配置成应用目标信号的有噪声和/或处理后版本x的修改,从而反映听者的相应耳朵与正常听力之间的偏差,进而提供目标信号的修改后的有噪声和/或处理后版本x以与目标信号的实质上无噪声版本s一起用作计算最终单耳语音可懂度预测值d的基础。5.根据权利要求1所述的单耳语音可懂度预测单元,其中所述听力损失模型单元配置成添加统计上独立的噪声信号,其根据听者的相应耳朵的听力图、目标信号的有噪声和/或处理后版本x进行谱整形。6.根据权利要求1所述的单耳语音可懂度预测单元,适于将时域包络信号xj(m)和sj(m)分别提取为:其中,z表示x或s,j=1,…,J和m=1,…,M,及k1(j)和k2(j)指对应于第j个子频带的低和高截止频率的DFT窗口指数,J为子频带的数量,及M为所涉及信号中的信号帧的数量,f(·)为函数。7.根据权利要求6所述的单耳语音可懂度预测单元,其中函数f(·)=f(w),其中w表示该函数在下述函数之中选择或其组合:-f(w)=w表示恒等;-f(w)=w2提供功率包络;-f(w)=2·logw或f(w)=wβ,0<β<2,使能对健康耳蜗的压缩非线性进行建模。8...

【专利技术属性】
技术研发人员:J·詹森J·M·德哈恩A·H·安德森
申请(专利权)人:奥迪康有限公司
类型:发明
国别省市:丹麦,DK

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1