场景识别方法、装置、电子设备以及计算机可读存储介质制造方法及图纸

技术编号：26652041 阅读：50 留言：0更新日期：2020-12-09 00:54

本申请公开了一种场景识别方法、装置、电子设备以及计算机可读存储介质，该场景识别方法包括：获取语音通信过程中的音频信号以及参考回声信号；分别计算音频信号的功率以及参考回声信号的功率；基于音频信号的功率以及参考回声信号的功率，计算音频信号的对数似然比；将对数似然比分别与第一预设阈值和第二预设阈值进行比较，其中，第一预设阈值小于第二预设阈值；在对数似然比大于第一预设阈值，且小于第二预设阈值的情况下，确定场景为回声突变场景。上述方案，能够通过引入对数似然比提高识别回声突变场景的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
场景识别方法、装置、电子设备以及计算机可读存储介质
本申请涉及音频处理应用
，特别是涉及一种场景识别方法、装置、电子设备以及计算机可读存储介质。
技术介绍
在现实生活中，当用户使用手机开启免提电话或者视频会议终端进行视频会议时，由于扬声器的外放会导致扬声器播放的声音再次被麦克风采集到，从而导致回声问题。回声问题会严重影响通话质量以降低语音通话中的交流与合作，通常来说，一般会使用回声消除算法来解决回声问题。使用回声消除算法之前，需要准确检测出回声场景。然而，目前的场景识别方案只能区分双端讲话和远端单讲场景，无法准确识别出回声场景，导致无法很好地解决语音通话中的回声问题。
技术实现思路
本申请至少提供一种场景识别方法、装置、电子设备以及计算机可读存储介质。本申请第一方面提供了一种场景识别方法，所述场景识别方法包括：获取语音通信过程中的音频信号以及参考回声信号；分别计算所述音频信号的功率以及所述参考回声信号的功率；基于所述音频信号的功率以及所述参考回声信号的功率，计...

【技术保护点】
1.一种场景识别方法，其特征在于，所述场景识别方法包括：/n获取语音通信过程中的音频信号以及参考回声信号；/n分别计算所述音频信号的功率以及所述参考回声信号的功率；/n基于所述音频信号的功率以及所述参考回声信号的功率，计算所述音频信号的对数似然比；/n将所述对数似然比分别与第一预设阈值和第二预设阈值进行比较，其中，所述第一预设阈值小于所述第二预设阈值；/n在所述对数似然比大于所述第一预设阈值，且小于所述第二预设阈值的情况下，确定所述场景为回声突变场景。/n

【技术特征摘要】
1.一种场景识别方法，其特征在于，所述场景识别方法包括：
获取语音通信过程中的音频信号以及参考回声信号；
分别计算所述音频信号的功率以及所述参考回声信号的功率；
基于所述音频信号的功率以及所述参考回声信号的功率，计算所述音频信号的对数似然比；
将所述对数似然比分别与第一预设阈值和第二预设阈值进行比较，其中，所述第一预设阈值小于所述第二预设阈值；
在所述对数似然比大于所述第一预设阈值，且小于所述第二预设阈值的情况下，确定所述场景为回声突变场景。

2.根据权利要求1所述的场景识别方法，其特征在于，
所述场景识别方法还包括：
在所述对数似然比小于所述第一预设阈值的情况下，确定所述场景为双讲场景；
在所述对数似然比大于所述第二预设阈值的情况下，确定所述场景为远端说话场景。

3.根据权利要求1所述的场景识别方法，其特征在于，所述场景识别方法还包括：
获取所述参考回声信号的幅值；
基于预设的遗忘因子以及所述参考回声信号的幅值计算每一帧参考回声信号的功率。

4.根据权利要求1所述的场景识别方法，其特征在于，所述音频信号至少包括背景噪声，所述场景识别方法还包括：
获取所述音频信号的幅值；
通过将不同帧所述音频信号的幅值作差，获取所述背景噪声的功率。

5.根据权利要求4所述的场景识别方法，其特征在于，所述音频信号还包括第一估计回声信号，所述场景识别方法还包括：
采用自适应滤波器获取所述第一估计回声信号的幅值；
通过将不同帧所述第一估计回声信号的幅值作差，获取所述第一估计回声信号的功率。

6.根据权利要求5所述的场景识别方法，其特征在于，所述音频信号还包括第二估计回声信号，所述场景识别方法还包括：

【专利技术属性】
技术研发人员：黄景标，林聚财，
申请(专利权)人：浙江大华技术股份有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人