基于语音端点检测的人工耳蜗自动增益控制方法和系统技术方案

技术编号:8900012 阅读:181 留言:0更新日期:2013-07-10 18:21
本发明专利技术公开了一种基于语音端点检测的人工耳蜗自动增益控制方法和系统,包括以下步骤:将采集的声信号进行放大处理;放大的声信号转换成数字信号;计算数字信号的短时能量,根据短时能量计算背景噪声值;读取当前增益值,若增益值为默认增益,设置语音短时能量的高门限,将输入的短时能量与语音短时能量的高门限进行比较,找出增益值调整的开始;若增益值为嘈杂环境默认增益,则设置语音短时能量的低门限,将输入的短时能量与语音短时能量的低门限进行比较,找出语音间隙;对转换的数字信号分频处理,并合并为N个通道;进行声-电刺激压缩并输出。通过本发明专利技术提升了人工耳蜗使用者的听音能力,改善植入者对声强输入波动较大时的言语识别效果。

【技术实现步骤摘要】

本专利技术涉及电子耳蜗
,特别是指一种基于语音端点检测的人工耳蜗自动增益控制方法和系统
技术介绍
人的耳蜗毛细胞是接收声音的感觉细胞。当耳蜗毛细胞损伤严重时,就会出现严重的听力损伤。电子耳蜗就是替代已损伤毛细胞,通过电刺激听觉神经重新获得声音信号的一种电子装置。附图说明图1显示的是电子耳蜗的结构示意图。电子耳蜗由体外机部件和植入体部件两部分组成,体外机部件主要包括传声器(如麦克风等)、言语处理器和发射线圈,植入体部件主要包括接收线圈、刺激器及多通道电极阵列组成。在系统连接正常的情况下,麦克风接收声信号,通过言语处理器,将声信号进行分析处理并编码,通过头件(发射线圈)透过皮肤传送到植入体部件的接收线圈,经过刺激器的解码处理后,产生相应频率及电流强度的脉冲信号并传送到各个刺激电极。通过电极刺激听神经,将脉冲信号传到听觉中枢从而为使用者产生听觉。对于正常听力者而言,声音的响度承受范围是120dB,而对于人工耳蜗植入者,电刺激的动态范围仅有5-15 dB左右。设计人工耳蜗言语处理的一个重要指标是输入声信号的动态范围,这决定了将多少动态范围的声信号压缩到5-15dB的电刺激动态范围上。一般助听器或人工耳蜗的自动增益系统以前一段时间输入的声信号声强作为调整增益的依据,增益调整的启动及恢复的时间是自动增益调整的核心参数。在助听器中,一般认为20ms左右的启动时间,200ms左右的恢复时间会让佩戴者最为舒适。而在人工耳蜗中200ms左右的启动时间,Is左右的恢复时间会让人工耳蜗植入者较为舒适。但在复杂的听音环境中,或是人工耳蜗植入者自己大声说话时,传统的自动增益系统可能会频繁的启动及恢复,会导致人工耳蜗植入者在听音时感觉声音忽大忽小。
技术实现思路
有鉴于此,本专利技术的目的在于提出一种基于语音端点检测的人工耳蜗自动增益控制方法和系统,提升了人工耳蜗使用者的听音能力,改善植入者对声强输入波动较大时的言语识别效果。基于上述目的本专利技术提供的一种基于语音端点检测的人工耳蜗自动增益控制方法,包括以下步骤:采集外界的声信号,并将采集的声信号进行放大处理;其中,放大处理的增益值设置有默认增益和嘈杂环境默认增益;在对初次采集的声信号进行放大处理时,初始增益值设置成默认增益;将放大后的声信号转换成数字信号;计算数字信号的短时能量,然后根据短时能量计算背景噪声值;读取当前增益值,若读取的增益值为默认增益,则设置语音短时能量的高门限,将输入的短时能量与语音短时能量的高门限进行比较,找出将放大处理时的初始增益值进行调整的语音端点的帧,即增益值调整的开始;若读取的增益值为嘈杂环境默认增益,则设置语音短时能量的低门限和过零率的高门限,将输入的短时能量与语音短时能量的低门限进行比较,再通过过零率的判断,确定语音的间隙,并在语音间隙将放大处理的增益值恢复为初始值;对转换的数字信号进行分频处理,并将处理的结果合并为N个通道;对N个通道的每个包络能量进行声-电刺激压缩并输出。可选地,计算数字信号的短时能量:首先,令输入的短时语音(通常取一帧20ms)信号为S(n);根据公式:Sw(n)=S(n)*G,得到放大后的语音信号Sw(n);其中,G为当前放大处理时的增益值;然后,根据放大后的语音信号Sw(n)得到短时能量E为:权利要求1.一种基于语音端点检测的人工耳蜗自动增益控制方法,其特征在于,包括以下步骤: 采集外界的声信号,并将采集的声信号进行放大处理;其中,放大处理的增益值设置有默认增益和嘈杂环境默认增益;在对初次采集的声信号进行放大处理时,初始增益值设置成默认增益; 将放大后的声信号转换成数字信号; 计算数字信号的短时能量,然后根据短时能量计算背景噪声值; 读取当前增益值,若读取的增益值为默认增益,则设置语音短时能量的高门限,将输入的短时能量与语音短时能量的高门限进行比较,找出将放大处理时的初始增益值进行调整的语音端点的帧,即增益值调整的开始;若读取的增益值为嘈杂环境默认增益,则设置语音短时能量的低门限和过零率的高门限,将输入的短时能量与语音短时能量的低门限进行比较,再通过过零率的判断,确定语音的间隙,并在语音间隙将放大处理的增益值恢复为初始值; 对转换的数字信号进行分频处理,并将处理的结果合并为N个通道JiN个通道的每个包络能量进行声-电刺激压缩并输出。2.根据权利要求1所述的方法,其特征在于,计算数字信号的短时能量:首先,令输入的短时语音(通常取一帧20ms)信号为S(n);根据公式:Sw(n)=S(n)*G,得到放大后的语音信号Sw(n);其中,G为当前放大处理时的增益值; 然后,根据放大后的语音信号Sw(n)得到短时能量E为:3.根据权利要求2所述的方法,其特征在于,根据短时能量计算背景噪声值: 首先,分别计算4个连续的20ms短时能量的均值; 然后,对此连续80ms的短时能量进行累加平均:Εn=(Ε1+Ε2+Ε3+Ε4)/4 ;其中,El, E2,E3,E4分别为4个连续20ms短时能量的均值;根据上述方法计算8s左右的时间内,每连续80ms的短时能量的均值,即En(1)至En (100); 最后,在8s左右的时间内,找出短时能量最小值,即为En(I)至En(IOO)之间的最小值,作为声信号背景噪声值。4.根据权利要求3所述的方法,其特征在于,读取当前增益值,若读取的增益值为默认增益,则设置语音短时能量的高门限: 当输入的短时能量小于语音短时能量的高门限时,保持当前增益值; 当输入的短时能量大于语音短时能量的高门限时,将下次对采集的声信号进行放大处理时的增益值调整为嘈杂环境默认增益。5.根据权利要求3所述的方法,其特征在于,若读取的增益值为嘈杂环境默认增益,则设置语音短时能量的低门限: 当输入的短时能量大于语音短时能量的低门限时,保持当前增益值; 当输入的短时能量小于语音短时能量的低门限时,计算当前帧信号的过零率,并且设置过零率高门限: 其中,当所得的过零率大于过零率高门限时,保持当前增益值;其中,当所得的过零率小于过零率高门限时,保持当前增益值;当连续检测到3帧信号的输入的短时能量小于语音短时能量的低门限,且同时满足得到的过零率小于过零率高门限,将放大处理的增益值恢复为初始值默认增益。6.一种基于语音端点检测的人工耳蜗自动增益控制系统,其特征在于,包括: 声信号采集单元,用于采集外界的声信号; 声信号放大单元,与声信号采集单元相连,用于将采集的声信号进行放大处理;其中,放大处理的增益值设置有默认增益和嘈杂环境默认增益;在对初次采集的声信号进行放大处理时,初始增益值设置成默认增益; 转换单元,与声信号放大单元相连,用于将放大后的声信号转换成数字信号; 短时能量和背景噪声值获取单元,与转换单元相连,用于计算数字信号的短时能量,然后根据短时能量计算背景噪声值; 增益状态读取单元,与短时能量和背景噪声值获取单元相连,用于读取当前声信号放大单元的增益值;若增益值为默认增益,则增益状态读取单元与增益状态I处理单元相连;若增益值为嘈杂环境默认增,则增益状态读取单元与增益状态2处理单元相连; 增益状态I处理单元,用于设置语音短时能量的高门限,将输入的短时能量与语音短时能量的高门限进行比较,找出将放大本文档来自技高网
...

【技术保护点】
一种基于语音端点检测的人工耳蜗自动增益控制方法,其特征在于,包括以下步骤:采集外界的声信号,并将采集的声信号进行放大处理;其中,放大处理的增益值设置有默认增益和嘈杂环境默认增益;在对初次采集的声信号进行放大处理时,初始增益值设置成默认增益;将放大后的声信号转换成数字信号;计算数字信号的短时能量,然后根据短时能量计算背景噪声值;读取当前增益值,若读取的增益值为默认增益,则设置语音短时能量的高门限,将输入的短时能量与语音短时能量的高门限进行比较,找出将放大处理时的初始增益值进行调整的语音端点的帧,即增益值调整的开始;若读取的增益值为嘈杂环境默认增益,则设置语音短时能量的低门限和过零率的高门限,将输入的短时能量与语音短时能量的低门限进行比较,再通过过零率的判断,确定语音的间隙,并在语音间隙将放大处理的增益值恢复为初始值;对转换的数字信号进行分频处理,并将处理的结果合并为N个通道;对N个通道的每个包络能量进行声?电刺激压缩并输出。

【技术特征摘要】

【专利技术属性】
技术研发人员:平利川陈洪斌唐国芳王松
申请(专利权)人:杭州诺尔康神经电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1