语音增强方法、相关设备及可读存储介质技术

技术编号:33130462 阅读:10 留言:0更新日期:2022-04-17 00:46
本申请公开了一种语音增强方法、相关设备及可读存储介质。在获取待增强语音之后,先对待增强语音进行预增强处理,得到预增强处理后的语音,然后判断预增强处理后的语音是否失真,当预增强处理后的语音失真时,对预增强处理后的语音进行修复,得到修复后的语音,最后基于修复后的语音,确定待增强语音对应的增强后的语音。本方案中,在确定预增强处理后的语音失真时,对预增强处理后的语音进行了修复,使得基于修复后的语音,确定的待增强语音对应的增强后的语音不存在失真问题,提升了语音增强的效果。强的效果。强的效果。

【技术实现步骤摘要】
语音增强方法、相关设备及可读存储介质


[0001]本申请涉及语音信号处理
,更具体的说,是涉及一种语音增强方法、相关设备及可读存储介质。

技术介绍

[0002]语音增强,旨在噪声/回声场景中获得干净的语音。其作为智能设备的前端信号处理被广泛应用于语音相关任务,如语音识别、语音唤醒等。
[0003]在一些场景中,采用目前的语音增强方案对待增强语音进行增强后,增强后的语音往往存在失真问题,导致语音增强效果较差。
[0004]因此,如何提升语音增强效果,成为本领域技术人员亟待解决的技术问题。

技术实现思路

[0005]鉴于上述问题,本申请提出了一种语音增强方法、相关设备及可读存储介质。具体方案如下:
[0006]一种语音增强方法,所述方法包括:
[0007]获取待增强语音;
[0008]对所述待增强语音进行预增强处理,得到预增强处理后的语音;
[0009]判断所述预增强处理后的语音是否失真;
[0010]当所述预增强处理后的语音失真时,对所述预增强处理后的语音进行修复,得到修复后的语音;基于所述修复后的语音,确定所述待增强语音对应的增强后的语音。
[0011]可选地,所述对所述待增强语音进行预增强处理,得到预增强处理后的语音,包括:
[0012]对所述待增强语音进行时频掩码估计,得到所述待增强语音的估计时频掩码;
[0013]基于所述待增强语音的估计时频掩码以及所述待增强语音,得到预增强处理后的语音。
[0014]可选地,所述对所述待增强语音进行时频掩码估计,得到所述待增强语音的估计时频掩码,包括:
[0015]将所述待增强语音输入第一语音增强模型,所述第一语音增强模型输出所述待增强语音的估计时频掩码;
[0016]所述第一语音增强模型是以第一训练用语音为训练样本,以第一训练用语音的真实时频掩码为样本标签,以第一语音增强模型输出的估计时频掩码趋近于所述第一训练用语音的真实时频掩码为训练目标训练得到的;所述第一训练用语音包括训练用纯净语音以及训练用噪声,所述第一训练用语音的真实时频掩码是基于所述第一训练用语音的信噪比计算得到的。
[0017]可选地,所述判断所述预增强处理后的语音是否失真,包括:
[0018]基于所述第一语音增强模型输出的所述待增强语音的估计时频掩码计算得到所
述待增强语音的信噪比;
[0019]当所述待增强语音的信噪比小于预设信噪比阈值时,确定所述预增强处理后的语音失真。
[0020]可选地,对所述待增强语音进行时频掩码估计,得到所述待增强语音的估计时频掩码,包括:
[0021]获取所述待增强语音的回声参考信号;
[0022]将所述待增强语音以及所述待增强语音的回声参考信号,输入第二语音增强模型,所述第二语音增强模型输出所述待增强语音的估计时频掩码;
[0023]所述第二语音增强模型是以第二训练用语音为训练样本,以第二训练用语音的真实时频掩码为样本标签,以第二语音增强模型输出的估计时频掩码趋近于所述第二训练用语音的真实时频掩码为训练目标训练得到的;所述第二训练用语音包括训练用纯净语音、训练用回声以及回声参考信号,所述训练用语音的真实时频掩码是基于所述训练用语音的信回比计算得到的。
[0024]可选地,所述判断所述预增强处理后的语音是否失真,包括:
[0025]对所述待增强语音对应的采集模式进行检测;
[0026]当所述待增强语音对应的采集模式为双讲模式时,基于所述第二语音增强模型输出的所述待增强语音的估计时频掩码,计算得到所述待增强语音的信回比;
[0027]当所述待增强语音的信回比小于预设信回比阈值时,确定所述预增强处理后的语音失真。
[0028]可选地,所述对所述预增强处理后的语音进行修复,得到修复后的语音,包括:
[0029]将所述预增强处理后的语音输入语音修复模型,所述语音修复模型对所述预增强处理后的语音进行相位和幅度修复,输出修复后的语音;
[0030]所述语音修复模型是以第三训练用语音为训练样本,以第三训练用语音对应的纯净语音的相位谱和幅度谱为样本标签,以语音修复模型对所述第三训练用语音只进行相位信息修复后输出的相位谱趋近于所述第三训练用语音对应的纯净语音的相位谱,且,所述语音修复模型对所述第三训练用语音只进行幅度信息修复后输出的幅度谱趋近于所述第三训练用语音对应的纯净语音的幅度谱为训练目标训练得到的。
[0031]一种语音增强装置,所述装置包括:
[0032]获取单元,用于获取待增强语音;
[0033]预增强处理单元,用于对所述待增强语音进行预增强处理,得到预增强处理后的语音;
[0034]失真判断单元,用于判断所述预增强处理后的语音是否失真;
[0035]修复单元,用于当所述预增强处理后的语音失真时,对所述预增强处理后的语音进行修复,得到修复后的语音;基于所述修复后的语音,确定所述待增强语音对应的增强后的语音。
[0036]可选地,所述预增强处理单元,包括:
[0037]时频掩码估计单元,用于对所述待增强语音进行时频掩码估计,得到所述待增强语音的估计时频掩码;
[0038]预增强处理后的语音确定单元,用于基于所述待增强语音的估计时频掩码以及所
述待增强语音,得到预增强处理后的语音。
[0039]可选地,所述时频掩码估计单元,包括:
[0040]第一处理单元,用于将所述待增强语音输入第一语音增强模型,所述第一语音增强模型输出所述待增强语音的估计时频掩码;
[0041]所述第一语音增强模型是以第一训练用语音为训练样本,以第一训练用语音的真实时频掩码为样本标签,以第一语音增强模型输出的估计时频掩码趋近于所述第一训练用语音的真实时频掩码为训练目标训练得到的;所述第一训练用语音包括训练用纯净语音以及训练用噪声,所述第一训练用语音的真实时频掩码是基于所述第一训练用语音的信噪比计算得到的。
[0042]可选地,所述失真判断单元,包括:
[0043]第一判断单元,用于基于所述第一语音增强模型输出的所述待增强语音的估计时频掩码计算得到所述待增强语音的信噪比;当所述待增强语音的信噪比小于预设信噪比阈值时,确定所述预增强处理后的语音失真。
[0044]可选地,所述时频掩码估计单元,包括:
[0045]第二处理单元,用于获取所述待增强语音的回声参考信号;将所述待增强语音以及所述待增强语音的回声参考信号,输入第二语音增强模型,所述第二语音增强模型输出所述待增强语音的估计时频掩码;
[0046]所述第二语音增强模型是以第二训练用语音为训练样本,以第二训练用语音的真实时频掩码为样本标签,以第二语音增强模型输出的估计时频掩码趋近于所述第二训练用语音的真实时频掩码为训练目标训练得到的;所述第二训练用语音包括训练用纯净语音、训练用回声以及回声参考信号,所述训练用语音的真实时频掩码是基本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音增强方法,其特征在于,所述方法包括:获取待增强语音;对所述待增强语音进行预增强处理,得到预增强处理后的语音;判断所述预增强处理后的语音是否失真;当所述预增强处理后的语音失真时,对所述预增强处理后的语音进行修复,得到修复后的语音;基于所述修复后的语音,确定所述待增强语音对应的增强后的语音。2.根据权利要求1所述的方法,其特征在于,所述对所述待增强语音进行预增强处理,得到预增强处理后的语音,包括:对所述待增强语音进行时频掩码估计,得到所述待增强语音的估计时频掩码;基于所述待增强语音的估计时频掩码以及所述待增强语音,得到预增强处理后的语音。3.根据权利要求2所述的方法,其特征在于,所述对所述待增强语音进行时频掩码估计,得到所述待增强语音的估计时频掩码,包括:将所述待增强语音输入第一语音增强模型,所述第一语音增强模型输出所述待增强语音的估计时频掩码;所述第一语音增强模型是以第一训练用语音为训练样本,以第一训练用语音的真实时频掩码为样本标签,以第一语音增强模型输出的估计时频掩码趋近于所述第一训练用语音的真实时频掩码为训练目标训练得到的;所述第一训练用语音包括训练用纯净语音以及训练用噪声,所述第一训练用语音的真实时频掩码是基于所述第一训练用语音的信噪比计算得到的。4.根据权利要求3所述的方法,其特征在于,所述判断所述预增强处理后的语音是否失真,包括:基于所述第一语音增强模型输出的所述待增强语音的估计时频掩码计算得到所述待增强语音的信噪比;当所述待增强语音的信噪比小于预设信噪比阈值时,确定所述预增强处理后的语音失真。5.根据权利要求1所述的方法,其特征在于,对所述待增强语音进行时频掩码估计,得到所述待增强语音的估计时频掩码,包括:获取所述待增强语音的回声参考信号;将所述待增强语音以及所述待增强语音的回声参考信号,输入第二语音增强模型,所述第二语音增强模型输出所述待增强语音的估计时频掩码;所述第二语音增强模型是以第二训练用语音为训练样本,以第二训练用语音的真实时频掩码为样本标签,以第二语音增强模型输出的估计时频掩码趋近于所述第二训练用语音的真实时频掩码为训...

【专利技术属性】
技术研发人员:黄远芳李明子马峰
申请(专利权)人:西安讯飞超脑信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1