音频信号处理方法、装置、设备及存储介质制造方法及图纸

技术编号：35844534 阅读：13 留言：0更新日期：2022-12-07 10:23

本公开涉及一种音频信号处理方法、装置、设备及存储介质。该方法包括：接收第一终端发送的第一音频信号；获取第二终端的音频采集装置所采集的第二音频信号；根据所述第一音频信号、所述第二音频信号和预先训练完成的深度学习模型，确定目标音频信号的特征信息，其中，所述第一音频信号和所述第二音频信号用于确定所述深度学习模型的输入信息，所述深度学习模型用于消除回声；根据所述目标音频信号的特征信息确定所述目标音频信号。其可以达到消除近端信号中的回声的目的。其可适用于近端用户和远端用户同时讲话的“双讲”情景，仅远端用户讲话的“单讲”情景，以及仅近端用户讲话的“单讲”情景。情景。情景。

全部详细技术资料下载

【技术实现步骤摘要】
音频信号处理方法、装置、设备及存储介质

[0001]本公开涉及信息
，尤其涉及一种音频信号处理方法、装置、设备及存储介质。

技术介绍

[0002]随着科技的不断发展，音频通话已成为人们远程沟通所常用的技术手段。在音频通话中，本地方称为近端，通话对方称为远端。远端音频经过本地扬声器播放后再次被本地的收音装置例如麦克风所采集的信号称为回声。
[0003]由于回声对近端信号会产生一定的影响，因此需要消除近端信号中的回声。但是，在近端用户和远端用户同时讲话的“双讲”情景。下，回声消除的效果不佳。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题，本公开提供了一种音频信号处理方法、装置、设备及存储介质。
[0005]第一方面，本公开实施例提供一种音频信号处理方法，所述方法包括：
[0006]接收第一终端发送的第一音频信号；
[0007]获取第二终端的音频采集装置所采集的第二音频信号；
[0008]根据所述第一音频信号、所述第二音频信号和预先训练完成的深度学习模型，确定目标音频信号的特征信息，其中，所述第一音频信号和所述第二音频信号用于确定所述深度学习模型的输入信息，所述深度学习模型用于消除回声；
[0009]根据所述目标音频信号的特征信息确定所述目标音频信号。
[0010]第二方面，本公开实施例提供一种模型训练方法，所述方法包括：
[0011]获取第一样本音频、第二样本音频和噪声样本音频；
[0012]根据...

【技术保护点】

【技术特征摘要】
1.一种音频信号处理方法，其中，所述方法包括：接收第一终端发送的第一音频信号；获取第二终端的音频采集装置所采集的第二音频信号；根据所述第一音频信号、所述第二音频信号和预先训练完成的深度学习模型，确定目标音频信号的特征信息，其中，所述第一音频信号和所述第二音频信号用于确定所述深度学习模型的输入信息，所述深度学习模型用于消除回声；根据所述目标音频信号的特征信息确定所述目标音频信号。2.根据权利要求1所述的方法，其中，根据所述第一音频信号、所述第二音频信号和预先训练完成的深度学习模型，确定目标音频信号的特征信息，包括：对所述第一音频信号和所述第二音频信号进行延迟对齐，得到延迟对齐后的第一音频信号和延迟对齐后的第二音频信号；根据所述延迟对齐后的第一音频信号和所述延迟对齐后的第二音频信号，确定所述深度学习模型的第一输入信息和第二输入信息；将所述第一输入信息和所述第二输入信息输入到所述深度学习模型，根据所述深度学习模型得到所述目标音频信号的特征信息。3.根据权利要求2所述的方法，其中，根据所述延迟对齐后的第一音频信号和所述延迟对齐后的第二音频信号，确定所述深度学习模型的第一输入信息和第二输入信息，包括：将所述延迟对齐后的第一音频信号的特征信息作为所述第一输入信息；或者对所述延迟对齐后的第一音频信号进行线性回声消除处理，得到第三音频信号，所述第三音频信号的特征信息为所述第一输入信息；将所述延迟对齐后的第二音频信号的特征信息作为所述第二输入信息；或者对所述延迟对齐后的第二音频信号进行线性回声消除处理，得到第四音频信号，所述第四音频信号的特征信息为所述第二输入信息。4.根据权利要求3所述的方法，其中，所述目标音频信号的特征信息包括所述目标音频信号的频谱掩码；根据所述目标音频信号的特征信息确定所述目标音频信号，包括：对所述第四音频信号进行时频变换，得到所述第四音频信号对应的频谱；根据所述目标音频信号的频谱掩码和所述第四音频信号对应的频谱，确定所述目标音频信号对应的频谱；对所述目标音频信号对应的频谱进行时频逆变换，得到所述目标音频信号；或者，根据所述目标音频信号的特征信息确定所述目标音频信号，包括：对所述延迟对齐后的第二音频信号进行时频变换，得到所述延迟对齐后的第二音频信号对应的频谱；根据所述目标音频信号的频谱掩码和所述延迟对齐后的第二音频信号对应的频谱，确定所述目标音频信号对应的频谱；对所述目标音频信号对应的频谱进行时频逆变换，得到所述目标音频信号。5.根据权利要求1所述的方法，其中，所述深度学习模型还用于抑制噪声；或/及所述第二音频信号包括回声音频信号、用户音频信号以及环境噪声信号。6.一种模型训练方法，其中，所述方法包括：获取第一样本音频、第二样本音频和噪声样本音频；根据所述第一样本音频确定回声样本音频；
将所述回声样本音频、所述第二样本音频和所述噪声样本音频进行混合处理，得到混合音频；根据所述第一样本音频、所述第二样本音频和所述混合音频，对深度学习模型进行训练，所述深度学习模型用于消除回声。7.根据权利要求6所述的方法，其中，根据所述第一样本音频确定回声样本音频，包括：根据所述第一样本音频和房间冲击响应确定所述回声样本音频；进一步地，根据所述第一样本音频、所述第二样本音频和所述混合音频，对深度学习模型进行训练，包括：根据所述第一样本音频和所述混合音频确定所述深度学习模型的第一输入样本和第二输入样本；将所述第一输入样本和所述第二输入样本输入到所述深度学习模型，根据所述...

【专利技术属性】
技术研发人员：王子腾，纳跃跃，刘章，田彪，付强，
申请(专利权)人：阿里巴巴新加坡控股有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人