【技术实现步骤摘要】
一种基于自适应采样率的降噪模型处理方法及系统
本专利技术涉及语音处理
,特别涉及一种基于自适应采样率的降噪模型处理方法及系统。
技术介绍
语音降噪是将混合语音中的噪声和人声分离出来,在尽可能完整保留人声部分的同时尽可能多的去除噪声部分。这可以有效提高语音通信或语音交互的质量,使人或机器在嘈杂的环境下也能听到清晰、干净的语音。传统的降噪方法在非平稳噪声环境下很难取得很好的效果,尤其对于瞬态的噪声更是无能为力,当前基于深度学习技术的降噪方法可以有效的去除快变的噪声,也取得了好的语音降噪效果,而目前主流的基于深度学习技术的降噪方法表现良好,但基于深度学习的降噪方法对数据的依赖较为严重。目前语音通信中两种主流的音频采样率是8kHz和16kHz,用16kHz的数据训练的模型对8kHz的数据处理效果不理想,同时,8kHz的数据训练的模型对16kHz的数据处理效果也不理想,如果同时将16k和8k的模型集成到算法,则会使算法的空间占用率大幅上升,因此设置了一种基于自适应采样率的降噪模型处理方法。
技术实现思路
本专 ...
【技术保护点】
1.一种基于自适应采样率的降噪模型处理方法,其特征在于,包括:/n对第一采样率的训练语音进行第一特征提取;/n对第一采样频率的训练语音进行重采样处理,并对重采样处理后的训练语音进行第二特征提取;/n计算与所述训练语音对应的纯净语音的实际比值掩膜;/n将提取的第一特征和第二特征输入到降噪模型,获得预测比值掩膜;/n基于所述实际比值掩膜与预测比值掩膜之间的误差,对所述降噪模型进行训练,直到所述实际比值掩膜与预测比值掩膜之间的误差不再变化,获得最终降噪模型,并保存。/n
【技术特征摘要】
1.一种基于自适应采样率的降噪模型处理方法,其特征在于,包括:
对第一采样率的训练语音进行第一特征提取;
对第一采样频率的训练语音进行重采样处理,并对重采样处理后的训练语音进行第二特征提取;
计算与所述训练语音对应的纯净语音的实际比值掩膜;
将提取的第一特征和第二特征输入到降噪模型,获得预测比值掩膜;
基于所述实际比值掩膜与预测比值掩膜之间的误差,对所述降噪模型进行训练,直到所述实际比值掩膜与预测比值掩膜之间的误差不再变化,获得最终降噪模型,并保存。
2.如权利要求1所述的降噪模型处理方法,其特征在于,所述重采样处理包括:
第一采样频率的训练语音进行下采样处理,获得第二采样率的训练语音;
对所述第二采样率的训练语音进行上采样处理,获得第一采样率的最终语音;
其中,所述第一采样率的最终语音即为所述重采样处理后的训练语音。
3.如权利要求1所述的降噪模型处理方法,其特征在于,基于所述实际比值掩膜与预测比值掩膜之间的误差,对所述降噪模型进行训练的过程中,还包括:
对所述实际比值掩膜与预测比值掩膜之间的误差进行预设数目次获取;
若每次获取的误差都在误差范围内,则训练收敛所述降噪模型,获得最终降噪模型,并保存。
4.如权利要求1所述的降噪模型处理方法,其特征在于,在获得最终降噪模型之后,还包括:
基于获得的最终降噪模型,并对预先获取的测试语音进行预处理,获得最终结果,并输出,其步骤包括:
判断所述预先获取的测试语音的采样率是否为第一采样率,若是,则不作重采样处理;
否则,判定所述预先获取的测试语音的采样率为第二采样率,并对第二采样率的测试语音进行升采样处理,获得相应的第一采样率的测试语音;
提取第一采样率对应的测试语音的第三特征;
将提取的第三特征输入到所述最终降噪模型中,获得测试比值掩膜;
将所述测试比值掩膜与第一采样率对应的测试语音进行融合处理,恢复所述测试语音的纯净语音;
如果所述预先获取的测试语音的采样率是第二采样率,则将恢复的纯净语音降采样到第二采样率后输出;
如果所述预先获取的测试语音的采样率是第一采样率,则不作处理,并直接输出。
5.如权利要求2或4任一所述的降噪模型处理方法,其特征在于,
所述第一采样率为16KHZ;
所述第二采样率为8KHZ。
6.一种基于自适应采样率的降噪模型处理系统,其特征在于,包括:
第一提取模块,用于对第一采样率的训练语音进行第一特征提...
【专利技术属性】
技术研发人员:李庆龙,关海欣,
申请(专利权)人:云知声智能科技股份有限公司,厦门云知芯智能科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。