通话信号的处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:23710400 阅读:24 留言:0更新日期:2020-04-08 12:11
本申请公开了通话信号的处理方法、装置、电子设备及存储介质,涉及语音技术领域。具体实现方案为:根据预设的至少两个阈值、基于通话信号构建的统计量,检测当前的通话状态;获取所述通话状态对应的增益因子;采用所述通话状态对应的增益因子对所述通话信号进行处理。本申请采用上述技术方案,能够对通话状态进行准确检测,并对残余信号进行有效地处理,避免处理后的语音出现不连续、卡顿的现象,能够有效地提高通话信号的处理效率。

【技术实现步骤摘要】
通话信号的处理方法、装置、电子设备及存储介质
本申请涉及计算机
,尤其涉及语音
,特别涉及一种通话信号的处理方法、装置、电子设备及存储介质。
技术介绍
随着互联网的高速发展,基于IP的语音传输(voiceoverinternetprotocol;voip)已经成为人们必不可少的需求之一,例如各种远程的电话会议都采用相关技术。现有的voip通信中,免提通信中存在的回声问题大大降低了通信双方的体验,这里回声是由扬声器和麦克风之间的耦合产生的。例如通信方A的声音被麦克风采集后经过网络传输给通信方B,并通过通信方B的扬声器播放出来,播放出来的声音又经过空气传输被通信方B的麦克风采集到,随后通信方B的麦克风采集到的声音又通过网络传回给通信方A,此时通信方A就会听到自己的回声。因此,有必要采取措施来消除回声以获得高质量的语音通信体验。现有的回声消除方法采用自适应滤波器来抑制线性部分的回声;并进一步对当前的通话状态进行检测,确定当前的通话状态,以基于通话状态进行有针对性地抑制残余回声。但是,由于语音的非平稳性以及通话场景的多样性,现有技术的方案都很难对通话状态进行准确有效地检测,从而残余回声的处理不够准确,进而导致处理后的语音出现不连续、卡顿等现象。
技术实现思路
为了解决上述技术问题,本申请提供一种通话信号的处理方法、装置、电子设备及存储介质,能够对通话状态进行准确地检测,进而对残余信号进行有效地处理,避免处理后的语音出现不连续、卡顿的现象。一方面,本申请提供一种通话信号的处理方法,包括:根据预设的至少两个阈值、基于通话信号构建的统计量,检测当前的通话状态;获取所述通话状态对应的增益因子;采用所述通话状态对应的增益因子对所述通话信号进行处理。进一步可选地,如上所述的方法中,根据预设的至少两个阈值、基于通话信号构建的统计量,检测当前的通话状态之前,所述方法还包括:基于残余信号和自适应滤波器估计的线性回声信号构建所述统计量;所述残余信号为所述自适应滤波器对麦克风信号中的线性回声信号滤除后剩余的信号。进一步可选地,如上所述的方法中,基于残余信号和自适应滤波器估计的线性回声信号构建所述统计量,包括:采用所述残余信号的能量除以所述自适应滤波器估计的线性回声信号的能量,作为所述统计量。进一步可选地,如上所述的方法中,根据预设的至少两个阈值、基于通话信号构建的统计量,检测当前的通话状态,包括:当所述至少两个阈值包括第一阈值和第二阈值,且所述第一阈值大于所述第二阈值时,判断所述统计量是否大于所述第一阈值;若大于,确定所述当前的通话状态为双讲状态;判断所述统计量是否小于所述第二阈值;若是,确定所述当前的通话状态为远端人说话状态;否则,若所述统计量小于或者等于所述第一阈值,且大于或者等于所述第二阈值,确定所述当前的通话状态为过渡状态。进一步可选地,如上所述的方法中,获取所述通话状态对应的增益因子,包括:若所述通话状态为远端说话人状态时,设置所述增益因子为0;若所述通话状态为双讲状态时,取第一信号相干度和第二信号相干度中的最小值作为所述增益因子;其中所述第一信号相干度为扬声器信号和所述麦克风信号之间的相干性,所述第二信号相干度为所述残余信号与所述麦克风信号之间的相干性;若所述通话状态为过渡状态时,取所述第一信号相干度和所述第二信号相干度中的最小值的平方作为所述增益因子。进一步可选地,如上所述的方法中,采用所述通话状态对应的增益因子对所述通话信号进行处理,包括:采用所述通话状态对应的增益因子乘以所述残余信号。另一方面,本申请还提供了一种通话信号的处理装置,包括:检测模块,用于根据预设的至少两个阈值、基于通话信号构建的统计量,检测当前的通话状态;获取模块,用于获取所述通话状态对应的增益因子;处理模块,用于采用所述通话状态对应的增益因子对所述通话信号进行处理。再一方面,本申请还提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上任一项所述的方法。又一方面,本申请还提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上任一项所述的方法。上述申请中的一个实施例具有如下优点或有益效果:根据预设的至少两个阈值、基于通话信号构建的统计量,检测当前的通话状态;获取通话状态对应的增益因子;并采用增益因子对通话信号进行处理,能够对通话状态进行准确检测,并对残余信号进行有效地处理,避免处理后的语音出现不连续、卡顿的现象,能够有效地提高通话信号的处理效率。而且,本申请的技术方案,通过设置两个阈值的方法对过渡态采用不同的处理措施,能有效改善误检和漏检的发生。进一步地,本申请的技术方案,还可以将通话状态分为远端说话人状态,双讲状态和过渡态,能更好地处理双讲时近端语音被剪切的问题,从而能够有效地提高处理后的通话信号的质量。进一步地,本申请的技术方案,还可以针对不同的通话状态,设置不同的增益因子,进而基于不同的增益因子,进行不同的后处理,能够更加准确地对通话信号进行处理,可以有效地提高语音质量,避免处理后的语音出现不连续、卡顿的现象。上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是根据本申请第一实施例的示意图;图2是根据本申请第二实施例的示意图;图3是用来实现本申请实施例的通话信号的处理方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。图1为本申请的通话信号的处理方法实施例的流程图。如图1所述,本实施例的通话信号的处理方法,具体可以包括如下步骤:S101、根据预设的至少两个阈值、基于通话信号构建的统计量,检测当前的通话状态;S102、获取通话状态对应的增益因子;S103、采用通话状态对应的增益因子对通话信号进行处理。本实施例的通话信号的处理方法的执行主体为通话信号的处理装置,该通话信号的处理装置可以为一个电子实体,或者也可以为采用软件集成的应用。另外,本实施例中通话涉及到的两端分别为近端和远端。本实施例的技术方案在使用时,具体可以将通话信号的处理装置设置在通话方的近端,用于对通话信号进行处理。下面介绍本实施例中涉及到的通话信号,可以包括如下几种:扬声器信号本文档来自技高网...

【技术保护点】
1.一种通话信号的处理方法,其特征在于,包括:/n根据预设的至少两个阈值、基于通话信号构建的统计量,检测当前的通话状态;/n获取所述通话状态对应的增益因子;/n采用所述通话状态对应的增益因子对所述通话信号进行处理。/n

【技术特征摘要】
1.一种通话信号的处理方法,其特征在于,包括:
根据预设的至少两个阈值、基于通话信号构建的统计量,检测当前的通话状态;
获取所述通话状态对应的增益因子;
采用所述通话状态对应的增益因子对所述通话信号进行处理。


2.根据权利要求1所述的方法,其特征在于,根据预设的至少两个阈值、基于通话信号构建的统计量,检测当前的通话状态之前,所述方法还包括:
基于残余信号和自适应滤波器估计的线性回声信号构建所述统计量;所述残余信号为所述自适应滤波器对麦克风信号中的线性回声信号滤除后剩余的信号。


3.根据权利要求2所述的方法,其特征在于,基于残余信号和自适应滤波器估计的线性回声信号构建所述统计量,包括:
采用所述残余信号的能量除以所述自适应滤波器估计的线性回声信号的能量,作为所述统计量。


4.根据权利要求2所述的方法,其特征在于,根据预设的至少两个阈值、基于通话信号构建的统计量,检测当前的通话状态,包括:
当所述至少两个阈值包括第一阈值和第二阈值,且所述第一阈值大于所述第二阈值时,判断所述统计量是否大于所述第一阈值;若大于,确定所述当前的通话状态为双讲状态;
判断所述统计量是否小于所述第二阈值;若是,确定所述当前的通话状态为远端人说话状态;否则,若所述统计量小于或者等于所述第一阈值,且大于或者等于所述第二阈值,确定所述当前的通话状态为过渡状态。


5.根据权利要求4所述的方法,其特征在于,获取所述通话状态对应的增益因子,包括:
若所述通话状态为远端说话人状态时,设置所述增益因子为0;
若所述通话状态为双讲状态时,取第一信号相干度和第二信号相干度中的最小值作为所述增益因子;其中所述第一信号相干度为扬声器信号和所述麦克风信号之间的相干性,所述第二信号相干度为所述残余信号与所述麦克风信号之间的相干性;
若所述通话状态为过渡状态时,取所述第一信号相干度和所述第二信号相干度中的最小值的平方作为所述增益因子。


6.根据权利要求2-5任一所述的方法,其特征在于,采用所述通话状态对应的增益因子对所述通话信号进行处理,包括:
采用所述通话状态对应的增益因子乘以所述残余信号。


7.一种通话信号的处理装置,其特征在于,包括:
检测模块,用于根据预设的至少两个阈值、基于通话信号构建的统计量,检测当前的通话状态...

【专利技术属性】
技术研发人员:任新蕾于利标李慧凤
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1