音频处理方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号：23606773 阅读：35 留言：0更新日期：2020-03-28 07:22

本申请实施例提供了一种音频处理的方法、装置、电子设备及计算机可读存储介质，涉及语音增强技术领域，该方法包括：获取空气传导音频采集设备采集的第一音频信号以及体传导音频采集设备采集到的第二音频信号，然后基于第一音频信号以及第二音频信号之间的信号相关性，对第一音频信号以及第二音频信号进行语音增强处理，得到语音增强处理后待输出的音频信号。本申请实施例实现了对耳机的音频采集设备采集到的信号进行音频增强，可以得到效果更好的音频信号，以进行语音传输或者语音识别等应用。

Audio processing method, device, electronic equipment and computer readable storage medium

全部详细技术资料下载

【技术实现步骤摘要】
音频处理方法、装置、电子设备及计算机可读存储介质
本申请涉及语音增强
，具体而言，本申请涉及一种音频处理方法、装置、电子设备及计算机可读存储介质。
技术介绍
随着信息技术的发展，耳机技术也随之发展。拥有两个音频采集设备(空气传导音频采集设备和体传导音频采集设备)的耳机应运而生。其中空气传导音频采集设备采集到的声音容易受到周围环境的干扰，因此采集到的声音中可能包含很多噪声，而体传导音频采集设备采集到的声音是通过身体组织传导(如骨传导)得到的，因此体传导音频采集设备采集到噪声较少，甚至不会采集到噪声。由于空气传导音频采集设备采集到的声音容易受到环境噪声的影响，因此空气传导采集到的声音为全频带的。而体传导音频采集设备采集到的声音是通过身体组织传导采集到的，因此即体传导音频采集设备采集到的声音高频部分丢失。因此设置有两个音频采集设备的耳机如何利用两个音频采集设备的不同特性得到效果更好的语音信号，并进行语音传输或者语音识别等应用成为一个关键问题。
技术实现思路
本申请提供了一种音频处理方法、装置、电子设备及计算机可读存储介质，用于利用耳机的两个音频采集设备的不同特性得到效果更好的语音信号，以进行语音传输或者语音识别等应用。具体技术方案如下所示：第一方面，提供了一种音频处理方法，该方法包括：获取空气传导音频采集设备采集的第一音频信号以及体传导音频采集设备采集到的第二音频信号；基于第一音频信号以及第二音频信号之间的信号相关性，对第一音频信号以及第二音频信号进行语音增强处理，...

【技术保护点】
1.一种音频处理方法，其特征在于，包括：/n获取空气传导音频采集设备采集的第一音频信号以及体传导音频采集设备采集到的第二音频信号；/n基于所述第一音频信号以及所述第二音频信号之间的信号相关性，对所述第一音频信号以及所述第二音频信号进行语音增强处理，得到语音增强处理后待输出的音频信号。/n

【技术特征摘要】
1.一种音频处理方法，其特征在于，包括：
获取空气传导音频采集设备采集的第一音频信号以及体传导音频采集设备采集到的第二音频信号；
基于所述第一音频信号以及所述第二音频信号之间的信号相关性，对所述第一音频信号以及所述第二音频信号进行语音增强处理，得到语音增强处理后待输出的音频信号。

2.根据权利要求1所述的方法，其特征在于，基于所述第一音频信号以及所述第二音频信号之间的信号相关性，对所述第一音频信号以及所述第二音频信号进行语音增强处理，包括：
对所述第一音频信号和第二音频信号分别进行噪声估计；
根据第一音频信号和第二音频信号对应的噪声估计结果，分别对第一音频信号和第二音频信号进行语音频谱估计；
根据第一音频信号和第二音频信号对应的语音频谱估计结果，对第一音频信号和第二音频信号进行语音增强处理。

3.根据权利要求2所述的方法，其特征在于，对所述第一音频信号进行噪声估计，包括：
确定所述第一音频信号对应的语音存在先验概率；
基于所述语音存在先验概率，对所述第一音频信号进行噪声估计。

4.根据权利要求3所述的方法，其特征在于，确定所述第一音频信号对应的语音存在先验概率，包括：
确定第一音频信号和第二音频信号间的信号频率幅度比；
基于所述信号频率幅度比，确定所述第一音频信号对应的语音存在先验概率。

5.根据权利要求3或4所述的方法，其特征在于，基于所述语音存在先验概率，对所述第一音频信号进行噪声估计，包括：
基于所述语音存在先验概率，确定对应的语音存在后验概率；
基于所述语音存在后验概率，对所述第一音频信号进行噪声估计。

6.根据权利要求2-5任一项所述的方法，其特征在于，根据第一音频信号和第二音频信号对应的语音频谱估计结果，对第一音频信号和第二音频信号进行语音增强处理，包括：
根据第一音频信号和第二音频信号对应的噪声估计结果，以及第一音频信号和第二音频信号对应的语音频谱估计结果，对第一音频信号和第二音频信号进行语音增强处理。

7.根据权利要求6所述的方法，其特征在于，根据第一音频信号和第二音频信号对应的噪声估计结果，以及第一音频信号和第二音频信号对应的语音频谱估计结果，对第一音频信号和第二音频信号进行语音增强处理，包括：
根据第一音频信号和第二音频信号对应的噪声估计结果，以及第一音频信号和第二音频信号对应的语音频谱估计结果，对所述第一音频信号和第二音频信号进行联合语音频谱估计；
根据得到的联合语音频谱估计结果，得到语音增强处理后待输出的音频信号。

8.根据权利要求7所述的方法，其特征在于，根据第一音频信号和第二音频信号对应的噪声估计结果，以及第一音频信号和第二音频信号对应的语音频谱估计结果，对所述第一音频信号和第二音频信号进行联合语音频谱估计，包括：
根据均值为第一音频信号的语音频谱估计结果，方差为第一音频信号的噪声估计结果的第一高斯分布模型，以及均值为第二音频信号的语音频谱估计结果，方差为第二音频信号的噪声估计结果的第二高斯分布模型，确定第三高斯分布模型的均值；
根据所述第三高斯分布模型的均值，确定对所述第一音频信号和第二音频信号进行联合语音频谱估计的联合语音频谱估计结果。

9.根据权利要求1-8任一项所述的方法，其特征在于，对所述第一音频信号以及所述第二音频信号进行语音增强处理之前，包括：
对所述第二音频信号进行环境音抵消处理，得到环境音抵消处理后的第二音频信号；
对所述第一音频信号以及所述第二音频信号进行语音增强处理，包括：
对所述第一音频信号以及环境音抵消处理后的第二音频信号进行语音增强处理。

10.根据权利要求9所述的方法，其特征在于，对所述第二音频信号进行环境音抵消处理，包括：
获取音频信号播放设备待播放的第三音频信号；
通过第三音频信号对第二音频信号进行环境音抵消处理，得到环境音抵消处理后的第二音频信号。

11.根据权利要求10所述的方法，其特征在于，通过第三音频信号对第二音频信号进行环境音抵消处理，包括：
检测当前是否处于语音激活状态，所述语音激活状态表征用户正在发出语音；
若检测到处于语音激活状态，则执行所述通过第三音频信号对第二音频信号进行环境音抵消处理的步骤。

12.根据权利要求11所述的方法，其特征在于，检测当前是否处于语音激活状态，包括：
根据所述第二音频信号和/或所述第三音频信号，确定音频信号播放设备信道和/或体传导音频采集设备信道是否处于语音激活状态；
若至少一个...

【专利技术属性】
技术研发人员：杨磊，王维钦，方兵晓，李云川，王立众，朱恒，马振昌，
申请(专利权)人：北京三星通信技术研究有限公司，三星电子株式会社，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人