通话语音处理方法与装置、终端设备和存储介质制造方法及图纸

技术编号:25315381 阅读:41 留言:0更新日期:2020-08-18 22:32
本公开提供了通话语音处理方法与装置、终端设备和存储介质。该方法的一具体实施方式包括:利用预设自适应滤波算法对音频输入设备实时采集的待处理语音数据进行声学回声消除得到消除后语音数据;响应于确定扬声器的当前增益大于预设可引起残留回声增益阈值以及确定当前通话为单讲状态,按照预先设定的扬声器增益与回声语音幅度阈值之间的对应关系,确定与扬声器的当前增益对应的回声语音幅度阈值;响应于确定消除后语音数据中的残留回声数据的语音幅度不小于所确定的回声语音幅度阈值,将消除后语音数据中残留回声数据的语音幅度降低到低于所确定的回声语音幅度阈值后输出消除后语音数据;该实施方式实现了在扬声器的增益较大时仍能实现回声消除。

【技术实现步骤摘要】
通话语音处理方法与装置、终端设备和存储介质
本公开涉及语音通信
,具体涉及通话语音处理方法与装置、终端设备和存储介质。
技术介绍
在语音通信中,有一个很影响通话质量的因素就是回声。回声就是指说话者通过通信设备发送给其他人的语音又重新又回到自己的听筒里的现象。回声会对说话者产生严重的干扰,必须想办法消除。一般,回声分为两种,即“电路回声”和“声学回声”。“电路回声”可以通过硬件设备的合理设计而消除。最复杂和最难消除的应该是所谓的“声学回声”。“声学回声”是指远端用户的声音从听筒出来以后,经过空气或其他的传播媒介传到近端用户的话筒,再通过话筒录音后又重新传到远端用户的听筒中形成的回声。当近端用户的放音音量比较大而录音设备和放音设备距离比较近时回声尤其明显。为了消除声学回声,目前大都采用声学回声消除(AcousticEchoCancellation,AEC)技术。AEC以扬声器输出的信号与由它产生的多路径回声之间的相关性为基础,建立远端信号的语音模型,并利用远端信号的语音模型对回声进行估计,通过自适应算法调整滤波器的迭代更新系数以估计出与实际回声路径逼近的回声,即估计回声。然后,将估计回声从音频输入设备采集的语音数据中减去,从而达到消除回声的目的。然而,AEC的抑制能力是有限的,在良好的声学设计的系统中,AEC一般也只能对声学回声提供20-30dB的抑制。然而在免提通话场景,特别是智能音箱用于电话场景,由于智能音箱通常会装备增益较大的扬声器,因此即使AEC工作正常,但是经过AEC之后输出的语音中可能存在残留回声,而残留回声还是会被增益较大的扬声器放大到人耳能听见的水平,即产生可闻的回声。
技术实现思路
本公开提出了通话语音处理方法和装置,用以解决现有声学回声消除中存在的在扬声器增益较大时仍然存在残留回声的问题。第一方面,本公开提供了一种通话语音处理方法,应用于终端设备中的处理器,其中,上述终端设备包括扬声器、音频输入设备、通信单元和处理器,该方法包括:实时获取上述音频输入设备采集的待处理语音数据;利用预设自适应滤波算法对上述待处理语音数据进行声学回声消除得到消除后语音数据;响应于确定上述扬声器的当前增益不大于预设可引起残留回声增益阈值或者当前通话为双讲状态,输出上述消除后语音数据;响应于确定上述扬声器的当前增益大于上述预设可引起残留回声增益阈值以及确定上述当前通话为单讲状态,执行以下残留回声消除操作:按照预先设定的扬声器增益与回声语音幅度阈值之间的对应关系,确定与上述扬声器的当前增益对应的回声语音幅度阈值;确定上述消除后语音数据中的残留回声数据的语音幅度是否小于所确定的回声语音幅度阈值;响应于确定不小于,将上述消除后语音数据中残留回声数据的语音幅度降低到低于所确定的回声语音幅度阈值后输出上述消除后语音数据;响应于确定小于,输出上述消除后语音数据。在一些可选的实施方式中,上述确定上述消除后语音数据中的残留回声数据的语音幅度是否小于所确定的回声语音幅度阈值,包括:按照上述预设自适应滤波算法确定上述消除后语音数据中的残留回声数据;确定上述消除后语音数据中的残留回声数据的语音幅度是否小于所确定的回声语音幅度阈值。在一些可选的实施方式中,上述预设自适应滤波算法包括以下至少一项:最小均方算法,归一化最小均方算法,最小二乘算法和仿射投影算法。在一些可选的实施方式中,上述当前通话为电话通话、网络语音通话或者网络视频通话。第二方面,本公开提供了一种通话语音处理装置,应用于终端设备中的处理器,其中,上述终端设备包括扬声器、音频输入设备、通信单元和处理器,该装置包括:获取单元,被配置成实时获取上述音频输入设备采集的待处理语音数据;声学回声消除单元,被配置成利用预设自适应滤波算法对上述待处理语音数据进行声学回声消除得到消除后语音数据;第一输出单元,被配置成响应于确定上述扬声器的当前增益不大于预设可引起残留回声增益阈值或者当前通话为双讲状态,输出上述消除后语音数据;第二输出单元,被配置成响应于确定上述扬声器的当前增益大于上述预设可引起残留回声增益阈值以及确定上述当前通话为单讲状态,执行以下残留回声消除操作:按照预先设定的扬声器增益与回声语音幅度阈值之间的对应关系,确定与上述扬声器的当前增益对应的回声语音幅度阈值;确定上述消除后语音数据中的残留回声数据的语音幅度是否小于所确定的回声语音幅度阈值;响应于确定不小于,将上述消除后语音数据中残留回声数据的语音幅度降低到低于所确定的回声语音幅度阈值后输出上述消除后语音数据;响应于确定小于,输出上述消除后语音数据。在一些可选的实施方式中,上述确定上述消除后语音数据中的残留回声数据的语音幅度是否小于所确定的回声语音幅度阈值,包括:按照上述预设自适应滤波算法确定上述消除后语音数据中的残留回声数据;确定上述消除后语音数据中的残留回声数据的语音幅度是否小于所确定的回声语音幅度阈值。在一些可选的实施方式中,上述预设自适应滤波算法包括以下至少一项:最小均方算法,归一化最小均方算法,最小二乘算法和仿射投影算法。在一些可选的实施方式中,上述当前通话为电话通话、网络语音通话或者网络视频通话。第三方面,本公开提供了一种终端设备,包括:音频输入设备,被配置成采集声音数据;扬声器,被配置成播放声音数据;通信单元,被配置成传输数据;一个或多个处理器;存储装置,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现第一方面中任一实现方式描述的方法。第四方面,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该计算机程序被一个或多个处理器执行时实现如第一方面中任一实现方式描述的方法。第五方面,本公开提供了一种电话会议系统,包括至少两个如第三方面中任一实现方式描述的终端设备。本公开提供的通话语音处理方法和装置,通过对从音频输入设备采集的语音数据进行传统声学回声消除后得到消除后语音数据的基础上,如果扬声器的当前增益不大于预设可引起残留回声增益阈值或者当前通话为双讲状态,则直接输出消除后语音数据;如果扬声器的当前增益大于预设可引起残留回声增益阈值以及当前通话为单讲状态的情况下,首先按照预先设定的扬声器增益与回声语音幅度阈值之间的对应关系,确定与扬声器的当前增益对应的回声语音幅度阈值;如果消除后语音数据中的残留回声数据的语音幅度小于所确定的回声语音幅度阈值,即这里的残留回声是没有意义的,则将消除后语音数据中残留回声数据的语音幅度降低到低于所确定的回声语音幅度阈值后输出消除后语音数据;如果消除后语音数据中的残留回声数据的语音幅度不小于所确定的回声语音幅度阈值,即这里的残留回声可能是有意义的,不能进一步抑制其中的残留回声,则直接输出消除后语音数据。从而实现了在扬声器增益较大的时候,也能实现较好的声学回声消除效果。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:图1是本公开的一个实施例可以应用于本文档来自技高网
...

【技术保护点】
1.一种通话语音处理方法,应用于终端设备中的处理器,其中,所述终端设备包括扬声器、音频输入设备、通信单元和处理器,所述方法包括:/n实时获取所述音频输入设备采集的待处理语音数据;/n利用预设自适应滤波算法对所述待处理语音数据进行声学回声消除得到消除后语音数据;/n响应于确定所述扬声器的当前增益不大于预设可引起残留回声增益阈值或者当前通话为双讲状态,输出所述消除后语音数据;/n响应于确定所述扬声器的当前增益大于所述预设可引起残留回声增益阈值以及确定所述当前通话为单讲状态,执行以下残留回声消除操作:按照预先设定的扬声器增益与回声语音幅度阈值之间的对应关系,确定与所述扬声器的当前增益对应的回声语音幅度阈值;确定所述消除后语音数据中的残留回声数据的语音幅度是否小于所确定的回声语音幅度阈值;响应于确定不小于,将所述消除后语音数据中残留回声数据的语音幅度降低到低于所确定的回声语音幅度阈值后输出所述消除后语音数据;响应于确定小于,输出所述消除后语音数据。/n

【技术特征摘要】
1.一种通话语音处理方法,应用于终端设备中的处理器,其中,所述终端设备包括扬声器、音频输入设备、通信单元和处理器,所述方法包括:
实时获取所述音频输入设备采集的待处理语音数据;
利用预设自适应滤波算法对所述待处理语音数据进行声学回声消除得到消除后语音数据;
响应于确定所述扬声器的当前增益不大于预设可引起残留回声增益阈值或者当前通话为双讲状态,输出所述消除后语音数据;
响应于确定所述扬声器的当前增益大于所述预设可引起残留回声增益阈值以及确定所述当前通话为单讲状态,执行以下残留回声消除操作:按照预先设定的扬声器增益与回声语音幅度阈值之间的对应关系,确定与所述扬声器的当前增益对应的回声语音幅度阈值;确定所述消除后语音数据中的残留回声数据的语音幅度是否小于所确定的回声语音幅度阈值;响应于确定不小于,将所述消除后语音数据中残留回声数据的语音幅度降低到低于所确定的回声语音幅度阈值后输出所述消除后语音数据;响应于确定小于,输出所述消除后语音数据。


2.根据权利要求1所述的方法,其中,所述确定所述消除后语音数据中的残留回声数据的语音幅度是否小于所确定的回声语音幅度阈值,包括:
按照所述预设自适应滤波算法确定所述消除后语音数据中的残留回声数据;
确定所述消除后语音数据中的残留回声数据的语音幅度是否小于所确定的回声语音幅度阈值。


3.根据权利要求2所述的方法,其中,所述预设自适应滤波算法包括以下至少一项:最小均方算法,归一化最小均方算法,最小二乘算法和仿射投影算法。


4.根据权利要求3所述的方法,其中,所述当前通话为电话通话、网络语音通话或者网络视频通话。


5.一种通话语音处理装置,应用于终端设备中的处理器,其中,所述终端设备包括扬声器、音频输入设备、通信单元和处理器,所述装置包括:
获取单元,被配置成实时获取所述音频输入设备采集的待处理语音数据;
声学回声消除单元,被配置成利用预设自适应滤波算法对所述待处理语音数...

【专利技术属性】
技术研发人员:张铖
申请(专利权)人:深圳市未艾智能有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1