一种音频降噪方法、装置、设备及存储介质制造方法及图纸

技术编号：37038761 阅读：38 留言：0更新日期：2023-03-29 19:18

本公开提供了一种音频降噪方法、装置、设备及存储介质，所述方法包括：首先，获取待降噪音频数据，然后利用预设实数网络模型估计待降噪音频数据的幅度时频掩蔽，能够得到待降噪音频数据对应的一阶增强幅度谱。进而，利用预设复数网络模型估计该待降噪音频数据的复数时频掩蔽，并结合一阶增强幅度谱和复数时频掩蔽，确定待降噪音频数据对应的降噪结果音频数据。本公开实施例利用预设实数网络模型增强待降噪音频数据的幅度谱，以及利用预设复数网络模型同时增强待降噪音频数据的幅度谱和相位谱，可见，本公开实施例能够实现对待降噪音频数据的降噪处理，从而较好的提升音频的音质。从而较好的提升音频的音质。从而较好的提升音频的音质。

全部详细技术资料下载

【技术实现步骤摘要】
一种音频降噪方法、装置、设备及存储介质

[0001]本公开涉及数据处理领域，尤其涉及一种音频降噪方法、装置、设备及存储介质。

技术介绍

[0002]音频录制的过程中，往往会由于环境或者设备等原因，导致录制的音频中存在有噪声的情况，从而造成音频给用户的体验感较差。
[0003]目前，对音频进行降噪的工具少之甚少，且仅有的几款降噪工具对音频降噪的效果也不尽人意。
[0004]因此，如何实现音频降噪，从而提升音频的音质，是目前亟需解决的技术问题。

技术实现思路

[0005]为了解决上述技术问题或者至少部分地解决上述技术问题，本公开实施例提供了一种音频降噪方法，能够实现对音频进行降噪，从而较好的提升音频的音质。
[0006]第一方面，本公开提供了一种音频降噪方法，所述方法包括：
[0007]获取待降噪音频数据；
[0008]利用预设实数网络模型估计所述待降噪音频数据的幅度时频掩蔽；其中，所述幅度时频掩蔽用于确定所述待降噪音频数据对应的一阶增强幅度谱；
[0009]利用预...

【技术保护点】

【技术特征摘要】
1.一种音频降噪方法，其特征在于，所述方法包括：获取待降噪音频数据；利用预设实数网络模型估计所述待降噪音频数据的幅度时频掩蔽；其中，所述幅度时频掩蔽用于确定所述待降噪音频数据对应的一阶增强幅度谱；利用预设复数网络模型估计所述待降噪音频数据的复数时频掩蔽；基于所述待降噪音频数据对应的一阶增强幅度谱和所述复数时频掩蔽，确定所述待降噪音频数据对应的降噪结果音频数据。2.根据权利要求1所述的方法，其特征在于，所述利用预设复数网络模型估计所述待降噪音频数据的复数时频掩蔽，包括：确定待降噪复数频谱；其中，所述待降噪复数频谱包括基于所述待降噪音频数据对应的一阶增强幅度谱和所述待降噪音频数据的原始相位谱确定的复数频谱，或者，基于所述待降噪音频数据的原始频谱和原始相位谱确定的复数频谱；将所述待降噪复数频谱输入至预设复数网络模型，经过所述预设复数网络模型的处理后，输出所述待降噪音频数据对应的复数时频掩蔽。3.根据权利要求1或2所述的方法，其特征在于，所述基于所述待降噪音频数据对应的一阶增强幅度谱和所述复数时频掩蔽，确定所述待降噪音频数据对应的降噪结果音频数据，包括：基于所述复数时频掩蔽，确定幅度增益和相位增益；基于所述相位增益和所述待降噪音频数据对应的原始相位谱，确定所述待降噪音频数据对应的相位增强谱；以及，基于所述幅度增益和所述待降噪音频数据对应的一阶增强幅度谱，确定所述待降噪音频数据对应的二阶增强幅度谱；基于所述二阶增强幅度谱和所述相位增强谱，确定所述待降噪音频数据对应的降噪结果音频数据。4.根据权利要求1所述的方法，其特征在于，所述预设实数网络模型和所述预设复数网络模型用于构成双阶段时域卷积网络TCN模型。5.根据权利要求4所述的方法，其特征在于，所述利用预设实数网络模型估计所述待降噪音频数据的幅度时频掩蔽...

【专利技术属性】
技术研发人员：舒晓峰，竺烨航，尚楚翔，陈彦洁，
申请(专利权)人：北京字跳网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人