当前位置: 首页 > 专利查询>清华大学专利>正文

一种全频域数字助听方法和设备技术

技术编号:3852066 阅读:226 留言:0更新日期:2012-04-11 18:40
本发明专利技术实施例提供了一种全频域数字助听方法,方法包括:获取前后双麦克风的输入语音信号,并进行分帧和傅里叶变换,以及进行语音场景类别的识别;当为带噪语音时,对分帧语音频域信号进行噪声检测并进行双麦克风波束形成处理、风噪声处理以及其它噪声抑制,然后进行频域动态范围压缩,以及声学反馈抑制;最后,进行反傅里叶变换和重叠相加得到输出语音信号。本发明专利技术实施例还提供了一种全频域数字助听设备。通过本发明专利技术实施例提供的方案,解决了目前数字助听器侧重于单纯解决听力障碍某一方面,而没有综合考虑影响使用效果各方面因素的问题,同时本发明专利技术实施例提供了全频域的数字助听方案,具有处理速度快,占用资源少,能耗低等优点。

【技术实现步骤摘要】

本专利技术涉及数字信号处理和医疗设备领域,特别涉及一种全频域数字助听方 法和设备。
技术介绍
声音是人类交流的一种重要手段,然而由于先天和后天的原因, 一些人的 听力受到损伤,成为耳聋患者。其中,数字助听器作为听力康复的最重要的手 段,给听力障碍患者带来一个动听的世界,同时也是人们高质量生活的一个重要标志o传统的模拟助听器通常使用线性放大电路,由于技术的限制,存在静态噪 音、哺叫、体积大、功耗高等缺点,不能得到令人满意的效果。数字助听器则 很好地克服了这些问题。但是由于人耳的听力障碍原因不同,语音环境千差万 别,导致数字助听器的设计非常复杂。目前存在的数字助听器大都侧重于解决 某一种因素导致的听力障碍问题,难以面面俱到,考虑到使用者的特殊情况。同时,目前数字助听器大都是在时域对语音信号进行处理,虽有部分助听 器在系统的某一部分采用频域处理的方式,但尚未有全频域处理的数字助听技 术。而全频域的数字助听技术在处理速度,功耗,听感等方面能提供更加让人 满意的效果。
技术实现思路
为了解决目前数字助听器侧重于单纯解决听力障碍某一方面,而没有综合 考虑影响使用效果各方面因素的问题,同时提高处理速度,减少占用资源,降 低能耗,本专利技术实施例提供了 一种全频域数字助听方法和设备。本专利技术实施例提供了一种全频域数字助听方法,所述方法包括 获取前后双麦克风的输入语音信号,对所述输入语音信号进行分帧,并对 分帧后的输入语音信号进行傅里叶变换,得到分帧语音频域信号;对所述分帧语音频域信号进行语音场景的识别,得到所述输入语音信号的语音场景类别;当所述输入语音信号的语音场景为带噪语音时,对所述分帧语音频域信号 进行语音检测,判断所述分帧语音频域信号中每一帧是语音帧还是噪声帧; 将经过语音检测后的分帧语音频域信号进行双麦克风波束形成处理; 对双麦克风波束形成的语音信号进行风噪声处理;将经过风噪声处理的语音信号进行其它噪声抑制,得到增强后的语音信号; 对增强后的语音信号进行频域动态范围压缩,得到补偿后的语音信号; 对补偿后的语音信号进行声学反馈抑制;对经过声学反馈抑制后的语音信号分别进行反傅里叶变换和重叠相加得到 输出语音信号。其中,所述对输入语音信号进行分帧,并对分帧后的输入语音信号进行傅里叶变换,得到分帧语音频域信号,包括对输入语音信号进行緩存分帧,并对分帧后的语音信号加窗; 将加窗后的每帧语音信号进行傅里叶变换,得到分帧语音频域信号。 其中,所述对所述分帧语音频域信号进行语音场景的识别,得到所述输入语音信号的语音场景类别,包括提取分帧语音频域信号的语音特征;对提取语音特征后的分帧语音频域信号进行场景识别,判断得到所述输入 语音信号的语音场景类别。进一步地,所述提取分帧语音频域信号的语音特征,包括 对加窗后的分帧语音频域信号计算功率谱;将语音信号的功率语经过三角窗滤波器组进行滤波,并对滤波后的语音信 号的功率谱取对数,得到对数功率语;将对数功率谱映射到低维空间,并对映射后的功率i普进行谱加权,得到谱 加权倒i脊系数,作为提取到的语音特征。进一步地,所述对提取语音特征后的分帧语音频域信号进行场景识别,判 断得到所述输入语音信号的语音场景类别,包括对分帧语音频域信号加载场景模型;冲艮据提取的语音特征,计算所述场景模型下所述分帧信号的概率;根据计算得到的概率,判别所述分帧信号的语音场景类别。其中,所述将经过语音检测后的分帧语音频域信号进行双麦克风波束形成处理,包括分别对前后麦克风经过语音检测后的分帧语音频域信号进行延时处理; 根据前后两个分帧信号、前后两个延时后的分帧信号,得到两个固定极性 方向性根据得到的两个固定极性方向性图,计算得到自适应增益; 根据自适应增益和两个固定极性方向性图,得到双麦克风波束形成的语音 信号。其中,所述对双麦克风波束形成的语音信号进4亍风噪声处理,包括 将后麦克风的分帧语音频域信号进行延时;计算前麦克风的分帧语音频域信号与延时后的后麦克风的分帧语音频域信号的归一化互相关系数;才艮据所述归一化互相关系数,得到分帧信号的风噪声抑制增益; 在低频率点上,将所述风噪声抑制增益与麦克风波束的语音信号求乘积,得到经过风噪声处理后的语音信号。其中,所述将经过风噪声处理的语音信号进行其它噪声抑制,得到增强后的语音信号,包括提取经过风噪声处理的语音信号的幅度和相位,并对幅度进行预处理; 将噪声幅度谱和语音幅度i普分为多个子带,并分别计算每个子带的过减因子;计算每个子带的谱减因子;根据过减因子、镨减因子、带噪语音幅度语和噪声幅度语,计算得到增强 后的i吾音幅度i普;根据相位,对增强后的语音幅度谱进行后处理,得到增强后的频域语音信号。其中,所述对增强后的语音信号进行频域动态范围压缩,得到补偿后的语 音信号,包括在已测定患者在特定频率处的听力损失情况后,计算特定频率信号处的信号声压级;ii根据所述信号声压级进行插值运算得到输出声压级; 根据所述信号声压级和所述输出声压级,计算得到增益; 根据得到的增益,计算分帧信号的频域滤波增益系数; 对所述频域滤波增益系数和所述特定频率信号求积,并将求积后的结果滤 波,得到补偿后的频域/f言号。其中,所述对补偿后的语音信号进行声学反馈抑制,包括 计算听力补偿后的语音信号的自相关信号; 根据所述自相关信号计算自相关信号的过零率;根据所述自相关信号过零率、信号的采样率以及自相关信号的点数,计算 哺叫所在频段的中心频率;才艮据所述中心频率设计陷波器,将补偿后的语音信号通过所述陷波器进行 声学反馈抑制。本专利技术实施例提供了一种全频域数字助听设备,所述设备包括 分帧模块,用于获取前后双麦克风的输入语音信号,对所述输入语音信号进行分帧,并对分帧后的输入语音信号进行傅里叶变换,得到分帧语音频域信号;场景识别模块,用于对所述分帧语音频域信号进行语音场景的识别,得到 所述输入语音信号的语音场景类别;语音检测模块,用于当所述输入语音信号的语音场景为带噪语音时,对所 述分帧语音频域信号进行语音检测,判断所述分帧语音频域信号中每一帧是语 音帧还是噪声帧;双麦克风波束模块,用于将经过语音检测后的分帧语音频域信号进行双麦克风波束形成处理;风噪声处理模块,用于对双麦克风波束形成的语音信号进行风噪声处理; 语音噪声抑制模块,用于将经过风噪声处理的语音信号进行其它噪声抑制,得到增强后的语音信号;频域动态范围压缩模块,用于对增强后的语音信号进行频域动态范围压缩,得到补偿后的语音信号;声学反馈模块,用于对补偿后的语音信号进行声学反馈抑制;输出模块,用于对经过声学反馈抑制后的语音信号分别进行反傅里叶变换和重叠相加得到输出语音信号。其中,所述分帧模块,包括分帧加窗单元,用于对输入语音信号进行緩存分帧,并对分帧后的语音信号加窗;傅里叶变换单元,用于将加窗后的每帧语音信号进行补零,并对补零后的 语音信号进行傅里叶变换,得到分帧语音频域信号。其中,所述场景识别模块,包括提取特征单元,用于提取分帧语音频域信号的语音特征; 识别单元,用于对提取语音特征后的分帧语音频域信号进行场景识别,判 断得到所述输入语音信号的语音场景类别。 进一步地,所述提取特征单元,包括功率谱计算子单元,用于对加窗后的分帧语音频域信号计算功率谱;三角窗滤波子单元,用于将本文档来自技高网...

【技术保护点】
一种全频域数字助听方法,其特征在于,所述方法包括: 获取前后双麦克风的输入语音信号,对所述输入语音信号进行分帧,并对分帧后的输入语音信号进行傅里叶变换,得到分帧语音频域信号; 对所述分帧语音频域信号进行语音场景的识别,得到所述输 入语音信号的语音场景类别; 当所述输入语音信号的语音场景为带噪语音时,对所述分帧语音频域信号进行语音检测,判断所述分帧语音频域信号中每一帧是语音帧还是噪声帧; 将经过语音检测后的分帧语音频域信号进行双麦克风波束形成处理;  对双麦克风波束形成的语音信号进行风噪声处理; 将经过风噪声处理的语音信号进行其它噪声抑制,得到增强后的语音信号; 对增强后的语音信号进行频域动态范围压缩,得到补偿后的语音信号; 对补偿后的语音信号进行声学反馈抑制;  对经过声学反馈抑制后的语音信号分别进行反傅里叶变换和重叠相加得到输出语音信号。

【技术特征摘要】

【专利技术属性】
技术研发人员:梁维谦翁海波夭淼董明易安希刘国旗刘润生
申请(专利权)人:清华大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利