【技术实现步骤摘要】
模型训练方法、音频处理方法、装置、设备、介质及产品
[0001]本公开涉及音频处理领域,更具体地说,涉及一种音频处理模型的训练方法、音频处理方法、装置、设备、介质及产品。
技术介绍
[0002]在用户编辑音视频的过程中,经常遇到需要将不同录制环境中的音频进行组合的情况,例如,在编辑一段音视频时,经常出现需要补录部分内容的情况,由于各种原因用户很难再回到原来的录制环境中去补录,此时,只能在另一种录制环境中进行补录,但由于两种录制环境存在差异,导致补录的内容在听感上与原来的音频存在较重的违和感,如何减轻这种违和感是目前所面临的问题。
技术实现思路
[0003]本公开提供一种音频处理模型的训练方法、音频处理方法、装置、设备、介质及产品,以至少解决上述相关技术中的问题。
[0004]根据本公开实施例的第一方面,提供一种音频处理模型的训练方法,包括:获取音频训练样本,其中,所述音频训练样本包括第一音频、第二音频和第三音频,所述第一音频为基于第一纯净语音和第一环境得到的混响音频,所述第二音频为基于第二纯净语音和第 ...
【技术保护点】
【技术特征摘要】
1.一种音频处理模型的训练方法,其特征在于,包括:获取音频训练样本,其中,所述音频训练样本包括第一音频、第二音频和第三音频,所述第一音频为基于第一纯净语音和第一环境得到的混响音频,所述第二音频为基于第二纯净语音和第二环境得到的混响音频,所述第三音频为基于所述第二纯净语音和所述第一环境得到的混响音频;基于所述第一音频,利用预先训练好的特征提取模型,得到所述第一环境的混响特征;基于所述第二音频和所述第一环境的混响特征,利用所述音频处理模型,得到估计的第三音频;基于所述估计的第三音频以及所述第三音频,计算第一损失函数的值;通过计算出的第一损失函数的值调整所述音频处理模型的参数,对所述音频处理模型进行训练。2.如权利要求1所述的音频处理模型的训练方法,其特征在于,所述第一音频、所述第二音频和所述第三音频通过下述操作得到:将所述第一纯净语音与所述第一环境的混响特征进行卷积,得到所述第一音频;将所述第二纯净语音与所述第二环境的混响特征进行卷积,得到所述第二音频;将所述第二纯净语音与所述第一环境的混响特征进行卷积,得到所述第三音频。3.如权利要求2所述的音频处理模型的训练方法,其特征在于,所述第一环境的混响特征为第一房间冲激响应,所述第二环境的混响特征为第二房间冲激响应,所述第一房间冲激响应和所述第二房间冲激响应通过镜像声源法生成。4.如权利要求1所述的音频处理模型的训练方法,其特征在于,所述特征提取模型通过自编码器实现,所述自编码器包括编码器和解码器;所述基于所述第一音频,利用预先训练好的特征提取模型,得到所述第一环境的混响特征,包括:基于所述第一音频,利用所述编码器获得所述第一环境的混响特征。5.一种音频处理方法,其特征在于,包括:获取在第一录制环境中录制第一纯净语音得到的第一音频和在第二录制环境中录制第二纯净语音得到的第二音频;基于所述第一音频,利用预先训练好的特征提取模型,获得所述第一录制环境的混响特征;基于所述第二音频以及所述第一录制环境的混响特征,利用预先训练好的音频处理模型,获得估计的在所述第一录制环境中录制第二纯净语音得到的第三音频。6.一种音频处理模型的训练装置,其特征...
【专利技术属性】
技术研发人员:任新蕾,郑羲光,张晨,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。