当前位置: 首页 > 专利查询>立声公司专利>正文

语音清晰度增强系统技术方案

技术编号:23564575 阅读:25 留言:0更新日期:2020-03-25 08:42
公开了一种用于困难声学条件的语音清晰度增强系统,该语音清晰度增强系统包括至少一个用于插入人的耳道(218)中的耳塞(201),该至少一个耳塞布置有面向耳道部分(401)和面向环境部分(402),并且该至少一个耳塞包括:声学衰减路径(214;214、213),其包括将所述面向环境部分(402)与所述面向耳道部分(401)耦接的通气孔(214);以及电声路径(202、204、209;202、203、204、208、209、210、211、212),其包括在所述面向环境部分(402)处的麦克风(202)、可变增益(204)和在所述面向耳道部分(401)处的扬声器(209);其中所述声学衰减路径(214;214、213)布置有从所述面向环境部分(402)到所述面向耳道部分(401)的具有低通特性的传递函数,该低通特性具有低通截止频率,并且所述低通特性通过对低于所述截止频率的频率的标称衰减(G

Speech intelligibility enhancement system

【技术实现步骤摘要】
【国外来华专利技术】语音清晰度增强系统
本专利技术涉及收听舒适度和语音识别的增强,尤其是在嘈杂的环境中和/或以其他方式挑战声学条件。
技术介绍
在嘈杂的环境中难以进行语音通信是常见的经验。特别是鸡尾酒会、咖啡馆和类似的情况带来了挑战,因为信号(会话伙伴的语音)非常相似,并且通常没有噪音(其他人的喋喋不休)响亮。听力正常的人需要进行大量的脑力活动来区分单词,并且听力损失非常轻微的人甚至需要更多的脑力活动。许多噪音抑制算法(包括自适应麦克风定向模式)在信噪比(SNR)方面表现出相当大的增益。然而,在实际测试中,例如由于处理人工产物和不自然的声音,它们常常无法提供更好的语音识别分数。传统的被动听力保护器通常衰减太多,特别是在较高的频率下,这使得语音识别更加糟糕。此外,传统的听力保护器引起闭塞(即,由于耳道堵塞而没有采取抵消措施,用户感觉到他自己的声音质量“空洞”、“低沉”或“轰鸣”)。所谓的音乐家耳塞旨在在广泛的音频频率范围内均匀衰减,以免扭曲音乐感知,该音乐家耳塞通常衰减太多,而无法用于理解嘈杂环境中的语音。它们通常也不处理闭塞效应。另一方面,助听器旨在通过使用放大声音的一般措施来改善可听性。这对于如上所述在嘈杂环境中难以理解语音的正常听力或接近正常听力的人来说通常没有帮助。此外,常规的助听器或者通过为自己嗓音的骨传导的声音提供逃离耳道的过多的通气孔来对抗闭塞效应,但因此也防止了低音频率的任何衰减,或者通过提供过少的通气孔,从而在用户说话时导致闭塞效应。针对上述挑战中的一个或多个的改善正常听力或接近正常听力的人在嘈杂环境中的收听舒适度和/或语音识别的耳部设备将是非常有利和有用的。
技术实现思路
专利技术人已经确认了上述问题和挑战,特别是涉及嘈杂环境中的听觉舒适度和会话清晰度,并且随后进行了下面描述的专利技术。专利技术人已经意识到如何将来自心理声学和听力学的许多众所周知的研究结果和理论与新颖特征相组合并应用以实现有利的组合技术效果,并且已经提供了这样的助听器,其增强了个人与他/她面前的人交谈的能力。本专利技术涉及一种用于困难声学条件的语音清晰度增强系统,该语音清晰度增强系统包括至少一个用于插入人的耳道中的耳塞,该至少一个耳塞布置有面向耳道部分和面向环境部分,并且该至少一个耳塞包括:声学衰减路径,其包括将所述面向环境部分与所述面向耳道部分耦接的通气孔;以及电声路径,其包括在所述面向环境部分处的麦克风、可变增益和在所述面向耳道部分处的扬声器;其中所述声学衰减路径布置有从所述面向环境部分到所述面向耳道部分的具有低通特性的传递函数,该低通特性具有低通截止频率,并且所述低通特性通过对低于所述截止频率的频率的标称衰减来衰减声音。本专利技术的实施例的有利效果是,即使在从声学衰减路径的面向环境部分到面向耳道部分施加了衰减,声学衰减路径的通气孔也减小闭塞效应。通过本专利技术的实施例,演示声压级(SPL)被优化以增加清晰度。当语音以非常低的水平呈现时是难以理解的,因为重要的语音提示是不可听见的,这使得难以区分音素。随着水平的提高,语音识别增加,直到某些时候识别开始随着水平的提高而恶化。这种现象通常被称为‘翻转’效应。在鸡尾酒会情况下,整体环境SPL通常高于翻转点。根据实施例,声学衰减路径应用标称衰减,从而增加在嘈杂环境中的大声语音或语音的清晰度。此外,根据实施例,电声路径还可应用负增益以增加语音的清晰度。本专利技术的有利特征是低音的被动处理,其中低于低通截止频率的频率在声学上衰减。许多常规的噪音抑制算法(包括自适应麦克风定向模式)在SNR中表现出显著的增益。然而,在实际测试中,它们常常无法提供更好的语音识别分数,因为这些算法易于产生吸引用户注意的“毛刺”或不自然的声音,从而减少对要识别的语音的关注甚至掩盖要识别的语音。本专利技术避免了这种情况。本专利技术通过施加轻微的一般衰减来促进在嘈杂或以其他方式的大声环境中长时间停留是有利的。例如,3dB的一般衰减可将噪音暴露减少50%,或另选地允许佩戴者在耳朵受到与没有系统的情况下相同的噪音暴露的情况下停留两倍的时长。为了进一步增强对暴露于大声的保护,有利的是包括用于限制递送到耳道的峰值SPL的装置。这可在声学衰减路径、在电声路径或两者中完成。所述峰值限制装置可包括声学机构,诸如通过窄槽、机电实现的,诸如使用具有有限运动的薄膜实现的。此外,可采用电声装置,诸如在检测到大声时简单地减小电增益和/或通过经由扬声器发出待衰减的声音的相位反转复制品。由于开放式耳道的共振,噪音引起的听力损失通常在3kHz附近最突出。因此,特别有利的是包括增益减小机构,其限制在3kHz附近的传输到耳朵的功率。在实施例中,所述标称衰减在500Hz下在2dB至10dB的范围内,诸如在500Hz下在2dB至8dB的范围内,诸如在500Hz下在2dB至6dB的范围内,诸如在500Hz下在2dB到5dB的范围内,诸如在500Hz下在3dB到5dB的范围内,诸如在500Hz下在3dB到4dB的范围内。在实施例中,在600Hz至1200Hz的范围内,诸如700Hz至1000Hz,诸如750Hz至900Hz,诸如800Hz,该低通截止频率为3dB转角频率。在实施例中,所述低通特性从50Hz到所述截止频率基本上是平坦的。在实施例中,所述电声路径布置有从所述面向环境部分到所述面向耳道部分的具有高通特性的传递函数,该高通特性具有高通截止频率,并且其中所述电声路径布置成对高于所述高通截止频率的频率应用高通增益。根据本专利技术,可变增益指定具有可控增益的信号处理块,从而使得电声路径能够应用高通增益。注意,增益可以是负的或正的。根据本专利技术的实施例,相对于系统应用高通增益有利于低能耗、扬声器的有利使用等。根据本专利技术的实施例,低通特性的应用有利于较少掩蔽由所述电声路径处理的高频分量。在实施例中,所述低通截止频率和所述高通截止频率在所述声学衰减路径和所述电声路径之间建立交叉频率。使用两种不同类型的路径有利于通过电声路径的传递函数和声学衰减路径的传递函数的组合来建立混合传递函数。组合传递函数的有利效果是系统的控制算法可仅关注控制高于交叉频率的频率。在实施例中,所述高通增益可在最小增益和最大增益之间控制。在实施例中,所述高通增益在3kHz下在-30dB至20dB的范围内,诸如在3kHz下在-25dB至15dB的范围内,诸如在3kHz下在-20dB至10dB的范围内。在实施例中,所述高通截止频率在600Hz至1200Hz的范围内,诸如700Hz至1000Hz,诸如750Hz至900Hz,诸如800Hz,所述高通截止频率为所述3dB转角频率。在实施例中,所述高通特性从至少为5kHz的所述截止频率起基本上是平坦的,诸如7kHz。在实施例中,所述耳塞包括增益控制器,该增益控制器被布置成控制所述可变增益。在实施例中,所述控制所述可变增益基于来自所述麦克风的信号。在实施例中,所述控制所述可变增益基于来自所述麦克风的信号的电平。本文档来自技高网
...

【技术保护点】
1.一种用于困难声学条件的语音清晰度增强系统,所述语音清晰度增强系统包括至少一个用于插入人的耳道(218)中的耳塞(201),所述至少一个耳塞布置有面向耳道部分(401)和面向环境部分(402),并且所述至少一个耳塞包括:/n声学衰减路径(214;214、213),所述声学衰减路径包括将所述面向环境部分(402)与所述面向耳道部分(401)耦接的通气孔(214);以及/n电声路径(202、204、209;202、203、204、208、209、210、211、212),所述电声路径包括在所述面向环境部分(402)处的麦克风(202)、可变增益(204)和在所述面向耳道部分(401)处的扬声器(209);/n其中所述声学衰减路径(214;214、213)布置有从所述面向环境部分(402)到所述面向耳道部分(401)的具有低通特性的传递函数,所述低通特性具有低通截止频率,并且所述低通特性通过对低于所述截止频率的频率的标称衰减(G

【技术特征摘要】
【国外来华专利技术】20170103 DK PA2017700021.一种用于困难声学条件的语音清晰度增强系统,所述语音清晰度增强系统包括至少一个用于插入人的耳道(218)中的耳塞(201),所述至少一个耳塞布置有面向耳道部分(401)和面向环境部分(402),并且所述至少一个耳塞包括:
声学衰减路径(214;214、213),所述声学衰减路径包括将所述面向环境部分(402)与所述面向耳道部分(401)耦接的通气孔(214);以及
电声路径(202、204、209;202、203、204、208、209、210、211、212),所述电声路径包括在所述面向环境部分(402)处的麦克风(202)、可变增益(204)和在所述面向耳道部分(401)处的扬声器(209);
其中所述声学衰减路径(214;214、213)布置有从所述面向环境部分(402)到所述面向耳道部分(401)的具有低通特性的传递函数,所述低通特性具有低通截止频率,并且所述低通特性通过对低于所述截止频率的频率的标称衰减(G0)来衰减声音。


2.根据权利要求1所述的系统,其中所述标称衰减(G0)在500Hz下在2dB至10dB的范围内,诸如在500Hz下在2dB至8dB的范围内,诸如在500Hz下在2dB至6dB的范围内,诸如在500Hz下在2dB到5dB的范围内,诸如在500Hz下在3dB到5dB的范围内,诸如在500Hz下在3dB到4dB的范围内。


3.根据权利要求1或2所述的系统,其中所述低通截止频率在600Hz至1200Hz的范围内,诸如700Hz至1000Hz,诸如750Hz至900Hz,诸如800Hz,所述低通截止频率为3dB转角频率。


4.根据前述权利要求中任一项所述的系统,其中所述低通特性从50Hz到所述截止频率基本上是平坦的。


5.根据前述权利要求中任一项所述的系统,其中所述电声路径(202、204、209;202、203、204、208、209、210、211、212)布置有从所述面向环境部分(402)到所述面向耳道部分(401)的具有高通特性的传递函数,所述高通特性具有高通截止频率,并且其中所述电声路径(202、204、209;202、203、204、208、209、210、211、212)布置成对高于所述高通截止频率的频率应用高通增益(102、103、104)。


6.根据前述权利要求中任一项所述的系统,其中所述低通截止频率和所述高通截止频率在所述声学衰减路径(214;214、213)与所述电声路径(202、204、209;202、203、204、208、209、210、211、212)之间建立交叉频率(fx)。


7.根据前述权利要求中任一项所述的系统,其中所述高通增益可在最小增益(GMIN)和最大增益(GMAX)之间控制。


8.根据前述权利要求中任一项所述的系统,其中所述高通增益在3kHz下在-30dB至20dB的范围内,诸如在3kHz下在-25dB至15dB的范围内,诸如在3kHz下在-20dB至10dB的范围内。


9.根据前述权利要求中任一项所述的系统,其中所述高通截止频率在600Hz至1200Hz的范围内,诸如700Hz至1000Hz,诸如750Hz至900Hz,诸如800Hz,所述高通截止频率为所述3dB转角频率。


10.根据前述权利要求中任一项所述的系统,其中所述高通特性从至少为5kHz的所述截止频率起基本上是平坦的,诸如7kHz。


11.根据前述权利要求中任一项所述的系统,其中所述耳塞(201)包括增益控制器(206),所述增益控制器(206)被布置成控制所述可变增益(204)。


12.根据前述权利要求中任一项所述的...

【专利技术属性】
技术研发人员:尼尔斯·法弗
申请(专利权)人:立声公司
类型:发明
国别省市:丹麦;DK

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1