【技术实现步骤摘要】
一种基于能量谱深度调制的语音增强方法及装置
[0001]本专利技术涉及语音增强技术,尤其涉及一种基于能量谱深度调制的语音增强方法及装置。
技术介绍
[0002]随着时代的快速发展,人们对于智能手机,可穿戴式设备如耳机,助听器等智能设备,大型会议,人机交互的使用要求越来越高。而往往在现实生活的使用过程中会受到来自环境的干扰。如对于耳弱患者来说需要佩戴助听器来获取外界的语音信息的时候,由于助听器的算法并不能实现很人性化的要求,经常在放大有效语音的同时也会将噪音一同放大,导致患者的听觉感受十分不舒适。同样的对于视频会议来说,会议现场的人门进行的动作,如摆动桌子,东西掉落,低声聊天等声音也会通过麦克风都传播到远处的线上会议上,让对面的听众听到很多嘈杂的声音干扰到对会议内容的了解学习。语音增强技术是为了能够准确的从复杂的背景噪声中提取出有效语音并进行增强,成为了语音领域一个重要且具有挑战性的研究课题。
[0003]在现如今,语音增强技术主要分为两个方法,一个基于传统的统计学原理,如谱减法,维拉滤波法,子空间算法等算法具有广泛的 ...
【技术保护点】
【技术特征摘要】
1.一种基于能量谱深度调制的语音增强方法,包括以下步骤:S1、将训练完毕的RNN网络封装至语音增强计算模块的步骤;S2、待处理带噪语音经过所述语音增强计算模块后输出增强语音的步骤;其特征在于,所述的RNN网络通过以下子步骤训练完成:S11、输入作为训练样本的纯净语音信号和噪声信号;S12、获取纯净语音信号和噪声信号的能量比值得到修正增益g1;S13、将所述纯净语音信号和噪声信号合成带噪声语音信号;S14、提取所述带噪声语音信号的特征参数;S15、获取通过能量谱深调制得到的初始增益g0;S16、周期追踪所述纯净语音信号和噪声信号得到时间差;S17、将所述修正增益g1、初始增益g0、特征参数和时间差作为训练参数对RNN网络进行训练;其中步骤S14的特征参数在数字处理电路中完成。2.根据权利要求1所述一种基于能量谱深度调制的语音增强方法,其特征在于,训练RNN网络是,将连续的中低频带量化划分为K个频带;根据K的数量不同得到不同级别的语言增益;其中K为大于10且小于25的自然数;频带数K越大,语音增强效果越好。3.根据权利要求2所述一种基于能量谱深度调制的语音增强方法,其特征在于,所述的频带数K为18或22。4.根据权利要求2所述一种基于能量谱深度调制的语音增强方法,其特征在于,所述步骤S12中,将纯净语音信号的时域信号x(i)转化频域信号X(i),将噪声信号的时域信号n(i)转化为频域信号N(i);其中i为K个频带中的序号,即i∈[1,K]。5.根据权利要求4所述一种基于能量谱深度调制的语音增强方...
【专利技术属性】
技术研发人员:李志坚,毛文健,李斌,吴朝晖,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。