【技术实现步骤摘要】
一种语音去噪的方法及装置
本申请涉及语音识别
,尤其涉及一种语音去噪的方法及装置。
技术介绍
由于城市环境中存在大量的噪声,例如,工业生产噪声、建筑施工噪声、交通运输噪声和社会生活噪声等,电子设备在采集的语音信号的过程中,例如,智能家居设备或车载音频设备,受环境噪声的影响,使得采集到的语音信号已非纯净的语音信号,而是受到噪声污染的带噪的语音信号。为了从带噪的语音信号中识别出语音信号,需要对语音进行去噪处理。目前,在非平稳噪声和强背景噪声环境下,主要是通过对噪声统计特性进行估计,基于噪声统计特性的估计对噪声的功率谱进行估计,但是当噪声功率较大,信噪比较低时,容易对噪声过估,造成微弱的语音信号的抑制,导致语音信号难以提取,以及提取的语音的质量较差的问题。
技术实现思路
本申请提供一种语音去噪的方法及装置,用以解决现有技术中语音信号难以提取,以及提取的语音的质量较差的技术问题。第一方面,本申请提供一种语音去噪的方法,该方法包括:电子设备接收带噪语音信号的集合,提取所述带噪语音信号的集合中各 ...
【技术保护点】
1.一种语音去噪的方法,其特征在于,包括:/n接收带噪语音信号的集合,提取所述带噪语音信号的集合中各个带噪语音信号的巴克频率倒谱系数BFCC特征;/n将所述BFCC特征输入到神经网络GRU中进行训练生成循环神经网络RNN模型,其中,所述RNN模型包括所述带噪语音信号的集合中各个噪声频谱的概率密度函数,各个噪声频谱的概率密度函数以及各个语音信号的增益补偿参数;/n接收待去噪的语音信号,并提取所述待去噪的语音信号的BFCC特征,将所述待去噪的语音信号的BFCC特征输入到所述RNN模型中,基于所述噪声频谱和语音频谱的概率密度函数确定所述待去噪的语音信号中的噪声频谱;/n根据所述待 ...
【技术特征摘要】
1.一种语音去噪的方法,其特征在于,包括:
接收带噪语音信号的集合,提取所述带噪语音信号的集合中各个带噪语音信号的巴克频率倒谱系数BFCC特征;
将所述BFCC特征输入到神经网络GRU中进行训练生成循环神经网络RNN模型,其中,所述RNN模型包括所述带噪语音信号的集合中各个噪声频谱的概率密度函数,各个噪声频谱的概率密度函数以及各个语音信号的增益补偿参数;
接收待去噪的语音信号,并提取所述待去噪的语音信号的BFCC特征,将所述待去噪的语音信号的BFCC特征输入到所述RNN模型中,基于所述噪声频谱和语音频谱的概率密度函数确定所述待去噪的语音信号中的噪声频谱;
根据所述待去噪的语音信号和所述待去噪的语音信号中的噪声频谱,确定所述待去噪的语音信号中的语音信号的增益补偿参数;
基于所述语音信号的增益补偿参数和所述待去噪的语音信号中的基音信号,生成去噪的语音信号。
2.如权利要求1所述的方法,其特征在于,将所述BFCC特征输入到神经网络GRU中进行训练生成循环神经网络RNN模型,包括:
所述BFCC特征在所述GRU网络传播过程中生成权重参数,其中,所述权重参数用于表征每个带噪语音信号的参数与所述BFCC特征之间的关系;
基于所述权重参数和所述BFCC特征训练生成所述带噪语音信号的参数,其中,所述带噪语音的参数包括噪声频谱的概率密度函数,语音频谱的概率密度函数以及语音信号的增益补偿参数;
基于所述带噪语音信号的参数生成所述RNN模型。
3.如权利要求1或2所述的方法,其特征在于,在提取所述待去噪的语音信号的BFCC特征之前,还包括:
基于预设的时长将所述待去噪的语音信号进行分段处理,得到多段等时长的待去噪的第一语音信号;
将所述第一语音信号进行加窗处理,以使得所述第一语音信号的频谱能量集中。
4.如权利要求3所述的方法,其特征在于,在接收待去噪的语音信号之后,还包括:
对所述待去噪的语音信号进行基音分析,确定基音信号的周期;
基于所述基音信号的周期确定基音滤波器,并将所述第一语音信号输入到所述基音滤波器中,得到所述基音信号。
5.如权利要求4所述的方法,其特征在于,基于所述语音信号的增益补偿参数和所述待去噪的语音信号中的基音信号,生成去噪的语音信号,包括:
将所述增益补偿参数与所述基音信号进行线性...
【专利技术属性】
技术研发人员:刘白皓,
申请(专利权)人:珠海格力电器股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。