【技术实现步骤摘要】
一种基于数据增强的降噪模型压缩方法及装置
本专利技术涉及语音降噪
,特别涉及一种基于数据增强的降噪模型压缩方法及装置。
技术介绍
语音降噪是将混合语音中的噪声和人声分离出来,在尽可能完整保留人声部分的同时尽可能多的去除噪声部分。这可以有效提高语音通信或语音交互的质量,使人或机器在嘈杂的环境下也能听到清晰、干净的语音。传统的降噪方法在非平稳噪声环境下很难取得很好的效果,尤其对于瞬态的噪声更是无能为力,当前基于深度学习技术的降噪方法可以有效的去除快变的噪声,取得更好的语音降噪效果。而目前主流的基于深度学习技术的降噪方法表现良好,但模型参数量比较大,且会有冗余,对计算资源的消耗比较严重。在移动设备上运行时,对功耗的要求就比较苛刻,所以在保证降噪性能几乎不变的前提下,模型压缩变的尤为重要。
技术实现思路
本专利技术提供一种模型的参数量少且降噪性能不变的基于数据增强的降噪模型压缩方法。本专利技术提供一种基于数据增强的降噪模型压缩方法,该方法具体包括步骤S1-S6:步骤S1:获取预设的初始Tea
【技术保护点】
1.一种基于数据增强的降噪模型压缩方法,其特征在于,包括:/n步骤S1:获取预设的初始Teacher模型;/n步骤S2:获取带噪的训练语音,以及获取所述带噪的训练语音对应的纯净语音;/n步骤S3:基于所述带噪的训练语音和所述纯净语音,对所述初始Teacher模型进行训练,待所述初始Teacher模型训练收敛后作为最终Teacher模型;/n步骤S4:获取预设的初始Student模型;/n步骤S5:获取实际采集的带噪实际语音;/n步骤S6:基于所述带噪的训练语音、最终Teacher模型和所述带噪实际语音对所述初始Student模型进行训练,待所述初始Student模型训练收敛 ...
【技术特征摘要】
1.一种基于数据增强的降噪模型压缩方法,其特征在于,包括:
步骤S1:获取预设的初始Teacher模型;
步骤S2:获取带噪的训练语音,以及获取所述带噪的训练语音对应的纯净语音;
步骤S3:基于所述带噪的训练语音和所述纯净语音,对所述初始Teacher模型进行训练,待所述初始Teacher模型训练收敛后作为最终Teacher模型;
步骤S4:获取预设的初始Student模型;
步骤S5:获取实际采集的带噪实际语音;
步骤S6:基于所述带噪的训练语音、最终Teacher模型和所述带噪实际语音对所述初始Student模型进行训练,待所述初始Student模型训练收敛后作为最终Student模型。
2.如权利要求1所述的基于数据增强的降噪模型压缩方法,其特征在于,还包括:
步骤S7:获取带噪测试语音,基于所述带噪测试语音对所述最终Student模型进行测试;当测试不通过时重复执行步骤S1至S6。
3.如权利要求1所述的基于数据增强的降噪模型压缩方法,其特征在于,所述步骤S3:基于所述带噪的训练语音和所述纯净语音,对所述初始Teacher模型进行训练,待所述初始Teacher模型训练收敛后作为最终Teacher模型;具体包括:
步骤S301:提取所述带噪的训练语音中的特征值作为第一特征值;
步骤S302:基于所述纯净语音和所述带噪的训练语音计算出实际时频掩蔽值;
步骤S303:将所述第一特征值输入初始Teacher模型中获得第一时频掩蔽值;计算出所述第一时频掩蔽值和所述实际时频掩蔽值之间的第一均方误差;
步骤S304:将所述第一特征值、所述第一时频掩蔽值和所述实际时频掩蔽值作为训练数据,所述第一均方误差作为损失函数,对所述初始Teacher模型进行训练;
步骤S305:待所述初始Teacher模型训练收敛后作为最终Teacher模型。
4.如权利要3所述的基于数据增强的降噪模型压缩方法,其特征在于,步骤S6:基于所述带噪的训练语音、最终Teacher模型和所述带噪实际语音对所述初始Student模型进行训练,待所述初始Student模型训练收敛后作为最终Student模型,具体包括:
步骤S601:将所述第一特征值输入所述最终Teacher模型中,预测出第二时频掩蔽值;
步骤S602:提取所述实际采集的带噪实际语音的特征值作为第二特征值;
步骤S603:将所述第二特征值输入所述最终Teacher模型中,预测出第三时频掩蔽值;
步骤S604:将所述第一特征值输入所述初始Teacher模型中,预测出第四时频掩蔽值;计算所述第四时频掩蔽值与所述第二时频掩蔽值之间的第二均方误差;
步骤S605:将所述第二特征值输入所述初始Student模型中,预测出第五时频掩蔽值;计算出所述第五时频掩蔽值和所述第三时频掩蔽值之间的第三均方误差;
步骤S606:将所述第一特征值和第二时频掩蔽值、所述第二特征值和第三时频掩蔽值作为训练数据,将所述第二均方误差和所述第三均方误差作为损失函数,对初始Student模型进行训练,待所述初始Student模型训练收敛后作为最终Student模型。
5.如权利要2或4所述的基于数据增强的降噪模型压缩方法,其特征在于,所述步骤S7:获取带噪测试语音,基于所述带噪测试语音对所述最终Student模型进行测试,当测试不通过时重复执行步骤S1至S6,具体包括:
步骤S701:提取所述带噪测试语音的特征值为第三特征值;
步骤S702:将所述第三特征值输入所述最终Student模型,预测出第六时频掩蔽值;
步骤S703:获取所述带噪测试语...
【专利技术属性】
技术研发人员:李庆龙,关海欣,
申请(专利权)人:云知声智能科技股份有限公司,厦门云知芯智能科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。