音频信号分离方法、装置、存储介质和电子设备制造方法及图纸

技术编号：31847816 阅读：52 留言：0更新日期：2022-01-12 13:29

本公开涉及一种音频信号分离方法、装置、存储介质和电子设备，其中方法包括：获取原始音频信号，其包括目标音频信号和背景音频信号；对原始音频信号进行短时傅里叶变换处理得到原始音频信号的频谱；将原始音频信号输入预设分离模型以得到目标音频信号对应的第一掩膜，基于第一掩膜和原始音频信号的频谱中的幅值谱生成目标音频信号对应的幅值谱；基于目标音频信号对应的幅值谱、原始音频信号的频谱中的相位谱得到目标音频信号对应的第一目标频谱；将第一目标频谱输入语音增强模型以得到目标音频信号对应的第二掩膜，基于第二掩膜和第一目标频谱，确定目标音频信号对应的第二目标频谱；对第二目标频谱进行短时傅里叶逆变换处理得到目标音频信号。理得到目标音频信号。理得到目标音频信号。

全部详细技术资料下载

【技术实现步骤摘要】
音频信号分离方法、装置、存储介质和电子设备

[0001]本公开实施例涉及音频信号处理
，尤其涉及一种音频信号分离方法、音频信号分离装置，以及实现音频信号分离方法的计算机可读存储介质和电子设备。

技术介绍

[0002]音乐课堂教学在教育领域发挥很大的作用，但是课堂上的音乐信号常常伴随着人声以及背景音乐如伴奏和噪声等，而音乐课堂常常需要提取出例如人声以更方便的教学，因此如何将人声从音乐信号中分离出来成为一个需要解决的问题。

技术实现思路

[0003]为了解决上述技术问题或者至少部分地解决上述技术问题，本公开实施例提供了一种音频信号分离方法、音频信号分离装置，以及实现音频信号分离方法的计算机可读存储介质和电子设备。
[0004]第一方面，本公开实施例提供了一种音频信号分离方法，包括：获取待分离的原始音频信号，所述原始音频信号包括目标音频信号和背景音频信号；对所述原始音频信号进行短时傅里叶变换处理，得到所述原始音频信号的频谱，所述频谱包括相位谱和幅值谱；将所述原始音频信号输入预设分离模型，以得到所述目标音频信号对应的第一掩膜，基于所述第一掩膜和所述原始音频信号的频谱中的幅值谱，生成所述目标音频信号对应的幅值谱；基于所述目标音频信号对应的幅值谱、所述原始音频信号的频谱中的相位谱，得到所述目标音频信号对应的第一目标频谱；将所述第一目标频谱输入语音增强模型，以得到所述目标音频信号对应的第二掩膜，基于所述第二掩膜和所述第一目标频谱，确定所述目标音频信号对应的第二目标频谱；对所述第二目标频谱进行短时傅里叶...

【技术保护点】

【技术特征摘要】
1.一种音频信号分离方法，其特征在于，包括：获取待分离的原始音频信号，所述原始音频信号包括目标音频信号和背景音频信号；对所述原始音频信号进行短时傅里叶变换处理，得到所述原始音频信号的频谱，所述频谱包括相位谱和幅值谱；将所述原始音频信号输入预设分离模型，以得到所述目标音频信号对应的第一掩膜，基于所述第一掩膜和所述原始音频信号的频谱中的幅值谱，生成所述目标音频信号对应的幅值谱；基于所述目标音频信号对应的幅值谱、所述原始音频信号的频谱中的相位谱，得到所述目标音频信号对应的第一目标频谱；将所述第一目标频谱输入语音增强模型，以得到所述目标音频信号对应的第二掩膜，基于所述第二掩膜和所述第一目标频谱，确定所述目标音频信号对应的第二目标频谱；对所述第二目标频谱进行短时傅里叶逆变换处理，得到目标音频信号。2.根据权利要求1所述的音频信号分离方法，其特征在于，所述语音增强模型是带有注意力机制的语音增强模型；所述将所述第一目标频谱输入语音增强模型，以得到所述目标音频信号对应的第二掩膜，包括：提取所述第一目标频谱的特征信息；基于所述注意力机制提取所述特征信息中的目标特征信息；基于所述特征信息和所述目标特征信息确定第二掩膜。3.根据权利要求1或2所述的音频信号分离方法，其特征在于，所述对所述原始音频信号进行短时傅里叶变换处理之前，所述方法包括：对所述原始音频信号添加具有不同预设信噪比的噪音信号，得到混和音频信号；将所述混和音频信号作为新的原始音频信号，返回所述对所述原始音频信号进行短时傅里叶变换处理的步骤。4.根据权利要求3所述的音频信号分离方法，其特征在于，所述对所述原始音频信号进行短时傅里叶变换处理，包括：对所述原始音频信号进行预处理，得到预处理音频信号；其中，所述预处理包括分帧处理和加窗函数处理；对所述预处理音频信号进行短时傅里叶变换处理。5.根据权利要求1或2所述的音频信号分离方法，其特征在于，所述基于所述第一掩膜和所述原始音频信号的频谱中的幅...

【专利技术属性】
技术研发人员：智鹏鹏，陈昌滨，
申请(专利权)人：北京世纪好未来教育科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人