【技术实现步骤摘要】
一种语音去噪方法和装置
本申请属于语音处理
,尤其涉及一种语音去噪方法和装置。
技术介绍
在发送语音消息时,背景噪音是不可避免,有效去除噪声可以提升语音的质量。且随着智能终端的使用越来越普及,语音聊天等也变得越来越普遍,因此语音去噪也就变得越来越重要。鉴于语音去噪在语音聊天中有着重要的作用,可以降低环境噪音,提升语音质量,语音去噪的方法也有很多,例如:谱减法、LMS(自适应滤波器)、维纳滤波法、最小均方误差法等等。然而,上述这些去噪方法都存在计算量较大的问题,因为计算量比较大必然会导致实时去噪时cpu占用率比较高,智能终端的性能难以满足实时去噪的要求。针对如何在保证去噪效果的同时,降低对CPU的占用,目前尚未提出有效的解决方案。
技术实现思路
本申请目的在于提供一种语音去噪方法和装置,可以实现在保证语音精度的同时,提高去噪速度和效率,以满足实时去噪的要求。本申请提供一种语音去噪方法和装置是这样实现的:一种语音去噪方法,所述方法包括:对待去噪语音信号进行FFT,得到多个频段的幅值和相位;根据所述多个频段中各个频段的带噪功率和噪声功率,计算得到各个频段的噪声抑制因子;将各个频段的幅值乘以对应的噪声抑制因子,得到各个频段去噪后的幅值;相位采用FFT得到的相位,幅值采用去噪后的幅值,进行IFFT得到去噪后的语音信号。一种语音去噪装置,所述装置包括:FFT模块,用于对待去噪语音信号进行FFT,得到多个频段的幅值和相位;计算模块,用于根据所述多个频段中各个频段的带噪功率和噪声功率,计算得到各个频段的噪声抑制因子;确定模块,用于将各个频段的幅值乘以对应的噪声抑制因子, ...
【技术保护点】
一种语音去噪方法,其特征在于,所述方法包括:对待去噪语音信号进行快速傅里叶变换FFT,得到多个频段的幅值和相位;根据所述多个频段中各个频段的带噪功率和噪声功率,计算得到各个频段的噪声抑制因子;将各个频段的幅值乘以对应的噪声抑制因子,得到各个频段去噪后的幅值;相位采用FFT得到的相位,幅值采用去噪后的幅值,进行快速傅里叶逆变换IFFT得到去噪后的语音信号。
【技术特征摘要】
1.一种语音去噪方法,其特征在于,所述方法包括:对待去噪语音信号进行快速傅里叶变换FFT,得到多个频段的幅值和相位;根据所述多个频段中各个频段的带噪功率和噪声功率,计算得到各个频段的噪声抑制因子;将各个频段的幅值乘以对应的噪声抑制因子,得到各个频段去噪后的幅值;相位采用FFT得到的相位,幅值采用去噪后的幅值,进行快速傅里叶逆变换IFFT得到去噪后的语音信号。2.根据权利要求1所述的方法,其特征在于,根据所述多个频段中各个频段的带噪功率和噪声功率计算得到各个频段的噪声抑制因子,包括:根据当前频段的带噪功率和噪声功率,计算当前频段的初始抑制因子;对所述当前频段的初始抑制因子进行修正,得到当前频段修正后的抑制因子;将当前频段修正后的抑制因子作为当前频段的噪声抑制因子。3.根据权利要求2所述的方法,其特征在于,根据当前频段的带噪功率和噪声功率,按照以下公式,计算当前频段的初始抑制因子:其中,ri0表示第i个频段的初始抑制因子,其中,第i个频段为当前频段,Rbasen是根据当前频段的幅值从拟合经验曲线中查找出的量值,Pi表示第i个频段的带噪功率,Ni表示第i个频段的噪声功率。4.根据权利要求2所述的方法,其特征在于,对所述当前频段初始抑制因子进行修正,得到当前频段修正后的抑制因子,包括:将所述当前频段的初始抑制因子与所述当前频段的相邻频段的初始抑制因子做平滑处理;将平滑处理后的初始抑制因子作为当前频段修正后的抑制因子。5.根据权利要求4所述的方法,其特征在于,按照以下公式,将所述当前频段的初始抑制因子与所述当前频段的相邻频段的初始抑制因子做平滑处理:其中,ri1表示当前频段平滑处理后的初始抑制因子,ωj表示第j个频段的权重值,表示第j个频段的初始抑制因子。6.根据权利要求4所述的方法,其特征在于,将平滑处理后的初始抑制因子作为当前频段修正后的抑制因子,包括:获取所述多个频段中各个频段初始抑制因子的最大值和最小值;根据所述最大值和最小值,对平滑处理后的初始抑制因子进行修正,得到当前频段修正后的抑制因子。7.根据权利要求6所述的方法,其特征在于,根据所述最大值和最小值,按照以下公式对平滑处理后的初始抑制因子进行修正,得到当前频段修正后的抑制因子:ri2=α·ri1+(1-α)·rmin其中,α表示第一加权系数,α=f(rmin,rmax),f为第一加权系数的计算公式,rmin表示所述最小值,rmax表示所述最大值。8.根据权利要求6所述的方法,其特征在于,在对平滑处理后的初始抑制因子进行修正,得到当前频段修正后的抑制因子之后,所述方法还包括:将当前频段修正后的抑制因子与所述待去噪语音信号的前一帧语音信号与所述当前频段相同频段的修正后的抑制因子做加权,得到加权后的抑制因子;相应的,将修正后的抑制因子作为噪声抑制因子,包括:将加权后的抑制因子作为当前频段的噪声抑制因子。9.根据权利要求8所述的方法,其特征在于,按照以下公式将当前频段修正后的抑制因子与所述待去噪语音信号的前一帧语音信号与所述当前频段相同频段的修正后的抑制因子做加权,得到加权后的抑制因子:其中,表示所述待去噪语音信号的前一帧语音信号与所述当前频段相同频段的修正后的抑制因子,ri表示所述加权后的抑制因子,ri2表示所述当前频段修正后的抑制因子,β表示第二加权系数。10.一种语音去噪装置,其特征在于,所述装置包括:FFT模块,...
【专利技术属性】
技术研发人员:杜志军,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。