【技术实现步骤摘要】
音频降噪、音频降噪模型的处理方法、装置、设备和介质
[0001]本申请涉及人工智能
,特别是涉及一种音频降噪方法、装置、计算机设备和存储介质,还涉及一种音频降噪模型的处理方法、装置、计算机设备和存储介质。
技术介绍
[0002]众所周知,音频信号一般都混有不同程度的噪声,例如用户在进行音频通话时可能处于各种场景,嘈杂的背景噪声将会对音频通话产生干扰。为了获得更好的音频质量,通常都会对原始音频信号进行降噪处理,传统的音频降噪方法如:自适应滤波器、谱减法以及维纳滤波法等等。
[0003]随着深度学习在人工智能
的普及,使用基于神经网络的深度学习模型对音频信号进行降噪处理,已经成为研究热点,其效果可优于传统的降噪算法。然而,目前已有的一些音频降噪模型,没有对输入的音频信号的频域信息进行最大化利用,导致音频降噪效果不佳。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够提升音频降噪效果的音频降噪方法、装置、计算机设备和存储介质,还提供了一种能够提升音频降噪效果的音频降噪模型的 ...
【技术保护点】
【技术特征摘要】
1.一种音频降噪方法,其特征在于,所述方法包括:获取时域的原始音频信号;通过训练好的频域处理子模型中的实部处理网络与虚部处理网络,分别对将所述原始音频信号变换为频域信号后获得的实部序列与虚部序列进行特征编码,获得所述原始音频信号对应的实部注意力与虚部注意力;基于所述实部序列与所述虚部序列、所述实部注意力与所述虚部注意力,获得所述原始音频信号对应的频域编码特征;将所述频域编码特征变换为时域信号,并通过训练好的时域处理子模型对所述时域信号进行降噪处理,获得所述原始音频信号对应的降噪信号。2.根据权利要求1所述的方法,其特征在于,所述通过训练好的频域处理子模型中的实部处理网络与虚部处理网络,分别对将所述原始音频信号变换为频域信号后获得的实部序列与虚部序列进行特征编码,获得所述原始音频信号对应的实部注意力与虚部注意力,包括:将所述原始音频信号输入训练好的频域处理子模型;在所述频域处理子模型中,对所述原始音频信号进行频域变换,获得所述原始音频信号对应的实部序列与虚部序列;通过所述频域处理子模型中的实部处理网络,分别对所述实部序列与所述虚部序列进行特征编码,获得实部第一编码特征与虚部第一编码特征;通过所述频域处理子模型中的虚部处理网络,分别对所述实部序列与所述虚部序列进行特征编码,获得实部第二编码特征与虚部第二编码特征;根据所述实部第一编码特征与所述虚部第二编码特征,获得所述原始音频信号对应的实部注意力,根据所述实部第二编码特征与所述虚部第一编码特征,获得所述原始音频信号对应的虚部注意力。3.根据权利要求1所述的方法,其特征在于,所述频域处理子模型中的实部处理网络与虚部处理网络包括至少两层;所述通过训练好的频域处理子模型中的实部处理网络与虚部处理网络,分别对将所述原始音频信号变换为频域信号后获得的实部序列与虚部序列进行特征编码,获得所述原始音频信号对应的实部注意力与虚部注意力,包括:通过所述频域处理子模型中首层的实部处理网络,分别对所述实部序列与所述虚部序列进行特征编码,获得实部第一编码特征与虚部第一编码特征;通过所述频域处理子模型中首层的虚部处理网络,分别对所述实部序列与所述虚部序列进行特征编码,获得实部第二编码特征与虚部第二编码特征;根据所述实部第一编码特征与所述虚部第二编码特征,获得所述原始音频信号在首层对应的实部注意力,根据所述实部第二编码特征与所述虚部第一编码特征,获得所述原始音频信号在首层对应的虚部注意力;迭代地通过当前层的实部处理网络与虚部处理网络对上一层对应的实部注意力与虚部注意力分别进行特征编码以获得当前层对应的实部注意力与虚部注意力,直至获得末尾层对应的实部注意力与虚部注意力时停止迭代。4.根据权利要求1所述的方法,其特征在于,所述基于所述实部序列与所述虚部序列、
所述实部注意力与所述虚部注意力,获得所述原始音频信号对应的频域编码特征,包括:将所述实部序列与所述实部注意力相乘,获得所述原始音频信号对应的频域编码特征的实部;将所述虚部序列与所述虚部注意力相乘,获得所述原始音频信号对应的频域编码特征的虚部。5.根据权利要求1所述的方法,其特征在于,所述基于所述实部序列与所述虚部序列、所述实部注意力与所述虚部注意力,获得所述原始音频信号对应的频域编码特征,包括:将所述实部序列与所述实部注意力相乘得到第一结果,将所述虚部序列与所述虚部注意力相乘得到第二结果,将所述第一结果与所述第二结果之差作为所述原始音频信号对应的频域编码特征的实部;将所述实部序列与所述虚部注意力相乘得到第三结果,将所述虚部序列与所述实部注意力相乘得到第四结果,将所述第三结果与所述第四结果之和作为所述原始音频信号对应的频域编码特征的虚部。6.根据权利要求1所述的方法,其特征在于,所述基于所述实部序列与所述虚部序列、所述实部注意力与所述虚部注意力,获得所述原始音频信号对应的频域编码特征,包括:基于所述实部序列与所述虚部序列,获得所述原始音频信号的原始幅值信息与原始相位信息,以及基于所述实部注意力与所述虚部注意力,获得所述原始音频信号的预测幅值信息与预测相位信息;根据所述原始幅值信息与所述预测幅值信息之积,获得所述原始音频信号对应的频域编码特征的幅值信息;根据所述原始相位信息与所述预测相位信息之和,获得所述原始音频信号对应的频域编码特征的相位信息。7.根据权利要求1所述的方法,其特征在于,所述通过训练好的时域处理子模型对所述时域信号进行降噪处理,获得所述原始音频信号对应的降噪信号,包括:将所述时域信号输入训练好的时域处理子模型;通过所述时域处理子模型中的编码器,对所述时域信号进行编码,获得时域编码向量;通过所述时域处理子模型中的时序特征提取网络,对所述时域编码向量进行特征提取,获得所述时域信号对应的隐藏特征;通过所述时域处理子模型中的解码器,基于所述时域编码向量和所述隐藏特征进行解码,获得所述原始音频信号对应的降噪信号。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:通过训练好的噪声分类子模型对所述时域信号进行分类处理,获得所述原始音频信号的噪声场景类别,所述噪声分类子模型是通过与所述时域处理子模型共同进行模型训练得到的。9.根据权利要求8所述的方法,其特征在于,所述通过训练好的噪声分类子模型对所述时域信号进行分类处理,获得所述原始音频信号的噪声场景类别,包括:将所述时域信号输入训练好的噪声分类子模型;通过所述噪声分类子模型中的编码器,对所述时域信号进行编码,获得时域编码向量;通过所述噪声分类子模型中的时序特征提取网络,对所述时域编码向量进行特征提
取,...
【专利技术属性】
技术研发人员:刘秋男,黄飞,石世昌,华超,杨梁,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。