一种语音增强方法、装置、设备及介质制造方法及图纸

技术编号:35305536 阅读:25 留言:0更新日期:2022-10-22 12:55
本发明专利技术公开了一种语音增强方法、装置、设备及介质。语音增强方法,包括:获取预处理语音信号;将预处理语音信号进行频域维纳滤波处理,得到第一滤波语音信号;根据第一滤波语音信号,确定基音分析结果,并根据基音分析结果以及预处理语音信号,确定目标特征;将目标特征输入至完成训练的RNN,得到各目标增益;根据基音分析结果以及预处理语音信号,确定基音滤波结果;根据各目标增益以及基音滤波结果,确定目标降噪语音信号。本发明专利技术实施例的技术方案实现传统信号处理理论与深度学习的结合,在不显著增加计算量的前提下,能够有效地抑制噪声。声。声。

【技术实现步骤摘要】
一种语音增强方法、装置、设备及介质


[0001]本专利技术涉及信号处理
,尤其涉及一种语音增强方法、装置、设备及介质。

技术介绍

[0002]在现实场景中,语音信号会被各种各样的噪声干扰、甚至淹没,从噪声背景中提取有用的语音信号,成为信号处理的研究热点。
[0003]噪声的来源众多,因应用场合而异,它们的特性也各不相同。针对不同噪声,采用不同的语音增强对策,传统的RNN(Recurrent Neural Network,循环神经网络)降噪算法的性能主要取决于基音滤波和RNN训练数据集,然而传统的RNN降噪算法的基音分析效果较差,导致降噪效果不理想。

技术实现思路

[0004]本专利技术提供了一种语音增强方法、装置、设备及介质,实现传统信号处理理论与深度学习的结合,在不显著增加计算量的前提下,能够有效地抑制噪声。
[0005]根据本专利技术的一方面,提供了一种语音增强方法,包括:
[0006]获取预处理语音信号;
[0007]将预处理语音信号进行频域维纳滤波处理,得到第一滤波语音信号;
...

【技术保护点】

【技术特征摘要】
1.一种语音增强方法,其特征在于,包括:获取预处理语音信号;将所述预处理语音信号进行频域维纳滤波处理,得到第一滤波语音信号;根据第一滤波语音信号,确定基音分析结果,并根据所述基音分析结果以及所述预处理语音信号,确定目标特征;其中,基音分析结果包括基音周期;将所述目标特征输入至完成训练的循环神经网络RNN,得到各目标增益;根据所述基音分析结果以及所述预处理语音信号,确定基音滤波结果;根据各目标增益以及所述基音滤波结果,确定目标降噪语音信号。2.根据权利要求1所述的方法,其特征在于,获取预处理语音信号,包括:获取待处理语音信号以及窗函数;根据所述窗函数,对所述待处理语音信号进行重叠加窗处理,得到重叠加窗语音信号;对所述重叠加窗语音信号进行傅里叶变换,得到所述预处理语音信号。3.根据权利要求1所述的方法,其特征在于,根据第一滤波语音信号,确定基音分析结果,包括:对所述第一滤波语音信号进行傅里叶逆变换,得到第一逆变换结果,并对所述第一逆变换结果进行重叠相加处理,得到第一重叠相加结果;将所述第一重叠相加结果进行基音分析,得到所述基音分析结果。4.根据权利要求1所述的方法,其特征在于,根据所述基音分析结果以及所述预处理语音信号,确定目标特征,包括:获取所述预处理语音信号的巴克频率倒谱系数,以及所述巴克频率倒谱系数在时域的一阶导数和二阶导数;计算所述预处理语音信号频带上基音相关度的离散余弦变换系数;根据所述基音分析结果,确定基音周期以及基音平稳度;根据所述巴克频率倒谱系数、所述巴克频率倒谱系数在时域的一阶导数以及二阶导数、所述离散余弦变换系数、所述基音周期以及所述基音平稳度,确定所述目标特征。5.根据权利要求1所述的方法,其特征在于,在将所述目标特征输入至完成训练的RNN,得到各目标增益之后,还包括:获取待插值频带;按照各待插值频带,对各目标增益依次进行线性插值,得到线性插值结果。6.根据权利要求5所述的方法,其特征在于,根据各目标增益以及所述...

【专利技术属性】
技术研发人员:李娟江雄杰
申请(专利权)人:辰芯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1