一种双讲状态检测方法、装置以及电子设备制造方法及图纸

技术编号：24173668 阅读：31 留言：0更新日期：2020-05-16 03:49

本申请公开了一种双讲状态检测方法、装置以及电子设备，涉及语音处理技术领域。具体实现方案为：计算误差信号在M个子带的每个子带上的第一能量与滤波信号在同一子带上的第二能量之间的能量比值，得到M个能量比值，其中，误差信号为麦克风采集的输入信号与滤波信号之间的差，滤波信号为对参考信号进行滤波处理后的信号，M为正整数；对M个能量比值进行第一平滑处理，得到M个第一能量平滑比值，以及对M个能量平滑比值进行第二平滑处理，得到M个第二能量平滑比值；依据M个第一能量平滑比值和M个第二能量平滑比值进行双讲状态检测，确定输入信号的状态。可提高状态检测准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种双讲状态检测方法、装置以及电子设备
本申请涉及计算机技术中的语音
，尤其涉及一种双讲状态检测方法、装置以及电子设备。
技术介绍
在一些电子设备中，例如可进行语音交互的智能音箱等，回声消除(AEC)起到关键作用，回声消除的效果直接智能音箱的语音交互性能。又例如，利用电子设备进行通话过程中通过回声消除可提升通话质量。在AEC算法中，为了更好的消除远端参考信号，并且保护近端语音信号，通常会有一个双讲检测模块。双讲检测模块用于检测当前信号的状态：单讲状态和双讲状态。单讲状态指仅有远端参考信号，双讲状态是指既有近端说话人的语音信号，又有远端参考信号。现有的双讲状态检测方法采用全带能量比的方法，即将麦克风采集的信号经线性滤波器处理之后的残余信号能量和扬声器的信号能量进行比较，若比值大于设定的检测门限则判断为双讲(doubletalk)状态，否则为单讲(singletalk)状态。然而，通过上述双讲状态检测方法进行状态检测时，当参考信号能量较大时，或近端信号的能量较小时(例如说话人声音很小)，容易出现误判，即容易...

【技术保护点】
1.一种双讲状态检测方法，其特征在于，所述方法包括：/n计算误差信号在M个子带的每个子带上的第一能量与滤波信号在同一子带上的第二能量之间的能量比值，得到M个能量比值，其中，所述误差信号为麦克风采集的输入信号与滤波信号之间的差，所述滤波信号为对参考信号进行滤波处理后的信号，M为正整数；/n对所述M个能量比值进行第一平滑处理，得到M个第一能量平滑比值，以及对所述M个能量平滑比值进行第二平滑处理，得到M个第二能量平滑比值；/n依据所述M个第一能量平滑比值和所述M个第二能量平滑比值进行双讲状态检测，确定所述输入信号的状态。/n

【技术特征摘要】
1.一种双讲状态检测方法，其特征在于，所述方法包括：
计算误差信号在M个子带的每个子带上的第一能量与滤波信号在同一子带上的第二能量之间的能量比值，得到M个能量比值，其中，所述误差信号为麦克风采集的输入信号与滤波信号之间的差，所述滤波信号为对参考信号进行滤波处理后的信号，M为正整数；
对所述M个能量比值进行第一平滑处理，得到M个第一能量平滑比值，以及对所述M个能量平滑比值进行第二平滑处理，得到M个第二能量平滑比值；
依据所述M个第一能量平滑比值和所述M个第二能量平滑比值进行双讲状态检测，确定所述输入信号的状态。

2.根据权利要求1所述的方法，其特征在于，所述依据所述M个第一能量平滑比值和所述M个第二能量平滑比值进行双讲状态检测，确定所述输入信号的状态，包括：
根据所述M个第二能量平滑比值，预测所述M个第二能量平滑比值的噪声；
根据所述M个第一能量平滑比值以及所述M个第二能量平滑比值的噪声，得到所述M个能量比值的信噪比；
根据所述M个能量比值的信噪比以及预设门限值进行双讲状态检测，确定所述输入信号的状态。

3.根据权利要求1所述的方法，其特征在于，所述滤波信号包括N帧滤波子信号，所述误差信号包括N帧误差子信号，N为正整数；
其中，目标子带上的所述能量比值包括所述目标子带上的N个子能量比，所述目标子带上的N个子能量比包括每一帧误差子信号在所述目标子带上的第一能量和对应帧滤波子信号在所述目标子带上的第二能量的能量比，所述目标子带上的所述第一能量平滑比值包括所述N个子能量比进行所述第一平滑处理后得到的N个第一子能量平滑比值，所述目标子带上的所述第二能量平滑比值包括所述N个第一子能量平滑比值进行所述第二平滑处理后得到的N个第二子能量平滑比值，所述目标子带为所述M个子带中的任一子带。

4.根据权利要求3所述的方法，其特征在于，通过以下公式对所述M个能量比值进行第一平滑处理：
ratio_short_sm(n+1,k)＝α*ratio_short_sm(n,k)+(1-α)*ratio(n+1,k)；
其中，α为第一平滑因子，所述ratio(n+1,k)为第n+1帧误差子信号在第k个子带上的第一能量与第n+1帧滤波子信号在第k个子带上的第二能量的子能量比，所述ratio_short_sm(n+1,k)为对所述ratio(n+1,k)进行第一平滑处理后得到的第一子能量平滑比值，ratio_short_sm(n,k)为对所述ratio(n,k)进行第一平滑处理后得到的第一子能量平滑比值，ratio(n,k)为第n帧误差子信号在第k个子带上的第一能量与第n帧滤波子信号在第k个子带上的第二能量的子能量比，n为正整数，且n≤N-1，k为正整数，且k≤M，ratio_short_sm(1,k)等于ratio(1,k)，ratio(1,k)为第1帧误差子信号在第k个子带上的第一能量与第1帧滤波子信号在第k个子带上的第二能量的子能量比。

5.根据权利要求3所述的方法，其特征在于，通过以下公式对对所述M个能量平滑比值进行第二平滑处理进行第二平滑处理：
ratio_long_sm(n+1,k)＝β*ratio_long_sm(n,k)+(1-β)*ratio_short_sm(n+1,k)；
其中，β为第二平滑因子，所述ratio_long_sm(n+1,k)为对所述ratio_short_sm(n+1,k)进行第二平滑处理后得到的第二子能量平滑比值，所述ratio_short_sm(n+1,k)为对所述ratio(n+1,k)进行第一平滑处理后得到的第一子能量平滑比值，所述ratio(n+1,k)为第n+1帧误差子信号在第k个子带上的第一能量与第n+1帧滤波子信号在第k个子带上的第二能量的子能量比，所述ratio_long_sm(n,k)为对所述ratio_short_sm(n,k)进行第二平滑处理后得到的第一子能量平滑比值，ratio_short_sm(n,k)为对所述ratio(n,k)进行第一平滑处理后得到的第一子能量平滑比值，ratio(n,k)为第n帧误差子信号在第k个子带上的第一能量与第n帧滤波子信号在第k个子带上的第二能量的子能量比，n为正整数，且n≤N-1，k为正整数，且k≤M，ratio_long_sm(1,k)等于ratio_short_sm(1,k)。

6.根据权利要求2所述的方法，其特征在于，所述根据所述M个能量比值的信噪比以及预设门限值进行双讲状态检测，确定所述输入信号的状态，包括：
计算所述M个能量比值的信噪比中I个能量比值信噪比的总和，I为正整数，且I≤M；
在所述总和大于所述预设门限的情况下，确定所述输入信号为双讲状态，或者，在所述总和小于或等于所述预设门限的情况下，确定所述输入信号为单讲状态。

7.一种双讲状态检测装置，其特征在于，所述装置包括：
第一计算模块，用于计算误差信号在M个子带的每个子带上的第一能量与滤波信号在同一子带上的第二能量之间的能量比值，得到M个能量比值，其中，所述误差信号为麦克风采集的输入信号...

【专利技术属性】
技术研发人员：吴俊楠，徐杨飞，宁峻，贡昱洲，周楠，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人