回声消除方法、装置及存储介质制造方法及图纸

技术编号:37117466 阅读:36 留言:0更新日期:2023-04-01 05:12
本公开是关于一种回声消除方法、装置及存储介质,该方法包括:获取对输入声音信号进行线性回声消除后的第一声音信号,以及对第一声音信号进行线性回声残留抑制后的第二声音信号;获取预先设置的非线性失真信号;将非线性失真信号映射至所述第一声音信号,得到映射信号;基于第一声音信号和映射信号,得到第二抑制值;基于第二抑制值和第二声音信号,得到回声消除后的声音信号。该方法可以以较低的计算复杂度较好地消除回声消除中的非线性回声,提升了用户体验。升了用户体验。升了用户体验。

【技术实现步骤摘要】
回声消除方法、装置及存储介质


[0001]本公开涉及音频处理
,尤其涉及一种回声消除方法、装置及存储介质。

技术介绍

[0002]双工语音通话场景,例如用户日常打电话时,远端与近端互通电话,远端的信号经过近端的扬声器播放出来,如果没有回声消除,会经过近端的麦克风采集和近端说话人信号混在一起被传递到远端,则会出现远端的用户听到自己说的话的情况。这种回声会给用户带来非常不好的通话体验。
[0003]为避免上述情况的发生,需要对双工语音通话场景中的声音信号进行回声消除处理。相关技术中回声消除通常包括线性回声消除和非线性回声消除,其中非线性回声消除是目前的一个技术难点,相关算法计算复杂度大多较高,且去除效果不佳。

技术实现思路

[0004]为克服相关技术中存在的问题,本公开提供一种回声消除方法、装置及存储介质。
[0005]根据本公开实施例的第一方面,提供一种回声消除方法,应用于终端,包括:
[0006]获取对输入声音信号进行线性回声消除后的第一声音信号,以及对所述第一声音信号进行线性回声残留抑制后的第二声音信号,其中,所述输入声音信号包括所述输入声音信号包括远端参考信号和/或所述终端的麦克风采集的信号,所述远端参考信号表征所述终端在双工通话场景中从远端传输至近端的信号;
[0007]获取预先设置的非线性失真信号;
[0008]将所述非线性失真信号映射至所述第一声音信号,得到映射信号,所述映射信号与所述第一声音信号的频域幅度在同一等级;
[0009]基于所述第一声音信号和所述映射信号,得到第二抑制值,所述第二抑制值用于对输入声音信号进行非线性回声抑制;
[0010]基于所述第二抑制值和所述第二声音信号,得到回声消除后的声音信号。
[0011]一种实施方式中,所述将所述非线性失真信号映射至所述第一声音信号,包括:
[0012]基于映射系数将所述非线性失真信号映射至所述第一声音信号,
[0013]其中,所述映射系数为在确定指定输入声音信号包括远端参考信号且不包括麦克风采集的信号时确定的,所述指定输入声音信号包括所述输入声音信号,或者所述输入声音信号之前最近一次接收到的输入声音信号。
[0014]一种实施方式中,通过谱减法对所述第一声音信号进行线性回声残留抑制处理得到所述第二声音信号;
[0015]所述确定指定输入声音信号包括远端参考信号不包括麦克风采集的信号,包括:
[0016]确定所述指定输入声音信号中的远端参考信号的语音活性检测连续N次大于第一门限值,N为正整数;且
[0017]确定所述根据所述指定输入声音信号得到的第二声音信号的语音活性检测小于
第二门限值;且
[0018]确定对所述根据所述指定输入声音信号得到的第一声音信号通过谱减法抑制处理得到的第一抑制值的均值小于第三门限值。
[0019]一种实施方式中,所述将所述非线性失真信号映射至所述第一声音信号,得到映射信号,包括:
[0020]通过归一化最小均方NLMS算法,根据上一次映射得到的映射系数、所述非线性失真信号的信号幅度、收敛因子和误差估计确定映射系数,其中,所述上一次映射得到的映射系数为所述输入声音信号之前最近一次接收到的输入声音信号包括远端参考信号不包括麦克风采集的信号时确定的映射系数;
[0021]基于所述映射系数和非线性失真信号确定所述映射信号。
[0022]一种实施方式中,确定映射系数的算式表示如下:
[0023]W(n+1)=W(n)+mu*x(n)*e(n)/(data+x(n)2)
[0024]其中,W(n+1)为本次映射确定的映射系数,W(n)为上一次映射确定的映射系数,n为迭代次数,n为正整数,mu为收敛因子,data为大于0的常数,x(n)为映射前的非线性失真信号幅度,e(n)为误差估计,e(n)=|aec_out1|

W(n)*|ref_abs|,aec_out1为第一声音信号,ref_abs为非线性失真信号,||为取幅度值运算。
[0025]一种实施方式中,所述基于所述第一声音信号和映射信号得到第二抑制值,包括:
[0026]基于所述第一声音信号和映射信号计算信回比SNR;
[0027]对所述信回比SNR进行平滑迭代,得到平滑迭代后的信回比SNR


[0028]基于所述平滑迭代后的信回比SNR

获得第二抑制值。
[0029]一种实施方式中,所述基于所述平滑迭代后的信回比SNR

获得第二抑制值,包括:
[0030]根据公式H2=SNR

/(SNR

+1)计算得到所述第二抑制值,其中,H2为第二抑制值。
[0031]一种实施方式中,所述预先设置的非线性失真信号通过对所述远端参考信号进行全波整流获得。
[0032]根据本公开实施例的第二方面,提供一种回声消除装置,包括:
[0033]第一获取模块,被配置为获取对输入声音信号进行线性回声消除后的第一声音信号,以及对所述第一声音信号进行线性回声残留抑制后的第二声音信号,其中,所述输入声音信号包括所述输入声音信号包括远端参考信号和/或终端的麦克风采集的信号,所述远端参考信号表征所述终端在双工通话场景中从远端传输至近端的信号;
[0034]第二获取模块,被配置为获取预先设置的非线性失真信号;
[0035]映射模块,被配置为将所述非线性失真信号映射至所述第一声音信号,得到映射信号,所述映射信号与所述第一声音信号的频域幅度在同一等级;
[0036]非线性回声消除模块,被配置为基于所述第一声音信号和所述映射信号,得到第二抑制值,所述第二抑制值用于对输入声音信号进行非线性回声抑制;以及
[0037]基于所述第二抑制值和所述第二声音信号,得到回声消除后的声音信号。
[0038]一种实施方式中,所述将所述非线性失真信号映射至所述第一声音信号,包括:
[0039]基于映射系数将所述非线性失真信号映射至所述第一声音信号,
[0040]其中,所述映射系数为在确定指定输入声音信号包括远端参考信号且不包括麦克风采集的信号时确定的,所述指定输入声音信号包括所述输入声音信号,或者所述输入声
音信号之前最近一次接收到的输入声音信号。
[0041]一种实施方式中,通过谱减法对所述第一声音信号进行线性回声残留抑制处理得到所述第二声音信号;
[0042]所述确定指定输入声音信号包括远端参考信号不包括麦克风采集的信号,包括:
[0043]确定所述指定输入声音信号中的远端参考信号的语音活性检测连续N次大于第一门限值,N为正整数;且
[0044]确定所述根据所述指定输入声音信号得到的第二声音信号的语音活性检测小于第二门限值;且
[0045]确定对所述根据所述指定输入声音信号得到的第一声音信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种回声消除方法,其特征在于,应用于终端,包括:获取对输入声音信号进行线性回声消除后的第一声音信号,以及对所述第一声音信号进行线性回声残留抑制后的第二声音信号,其中,所述输入声音信号包括远端参考信号和/或所述终端的麦克风采集的信号,所述远端参考信号表征所述终端在双工通话场景中从远端传输至近端的信号;获取预先设置的非线性失真信号;将所述非线性失真信号映射至所述第一声音信号,得到映射信号,其中,所述映射信号与所述第一声音信号的频域幅度在同一等级;基于所述第一声音信号和所述映射信号,得到第二抑制值,所述第二抑制值用于对输入声音信号进行非线性回声抑制;基于所述第二抑制值和所述第二声音信号,得到回声消除后的声音信号。2.根据权利要求1所述的方法,其特征在于,所述将所述非线性失真信号映射至所述第一声音信号,包括:基于映射系数将所述非线性失真信号映射至所述第一声音信号,其中,所述映射系数为在确定指定输入声音信号包括远端参考信号且不包括麦克风采集的信号时确定的,所述指定输入声音信号包括所述输入声音信号,或者所述输入声音信号之前最近一次接收到的输入声音信号。3.根据权利要求2所述的方法,其特征在于,通过谱减法对所述第一声音信号进行线性回声残留抑制处理得到所述第二声音信号;所述确定指定输入声音信号包括远端参考信号不包括麦克风采集的信号,包括:确定所述指定输入声音信号中的远端参考信号的语音活性检测连续N次大于第一门限值,其中,N为正整数;且确定所述根据所述指定输入声音信号得到的第二声音信号的语音活性检测小于第二门限值;且确定对所述根据所述指定输入声音信号得到的第一声音信号通过谱减法抑制处理得到的第一抑制值的均值小于第三门限值。4.根据权利要求3所述的方法,其特征在于,所述将所述非线性失真信号映射至所述第一声音信号,得到映射信号,包括:通过归一化最小均方NLMS算法,根据上一次映射得到的映射系数、所述非线性失真信号的信号幅度、收敛因子和误差估计确定映射系数,其中,所述上一次映射得到的映射系数为所述输入声音信号之前最近一次接收到的输入声音信号包括远端参考信号不包括麦克风采集的信号时确定的映射系数;基于所述映射系数和非线性失真信号确定所述映射信号。5.根据权利要求4所述的方法,其特征在于,确定映射系数的算式表示如下:W(n+1)=W(n)+mu*x(n)*e(n)/(data+x(n)2)其中,W(n+1)为本次映射确定的映射系数,W(n)为上一次映射确定的映射系数,n为迭代次数,n为正整数,mu为收敛因子,data为大于0的常数,x(n)为映射前的非线性失真信号幅度,e(n)为误差估计,e(n)=|aec_out1|

W(n)*|ref_abs|,aec_out1为第一声音信号,ref_abs为非线性失真信号,||为取幅度值运算。
6.根据权利要求5所述的方法,其特征在于,所述基于所述第一声音信号和映射信号得到第二抑制值,包括:基于所述第一声音信号和映射信号计算信回比SNR;对所述信回比SNR进行平滑迭代,得到平滑迭代后的信回比SNR

;基于所述平滑迭代后的信回比SNR

获得第二抑制值。7.根据权利要求6所述的方法,其特征在于,所述基于所述平滑迭代后的信回比SNR

获得第二抑制值,包括:根据公式H2=SNR

/(SNR

+1)计算得到所述第二抑制值,其中,H2为第二抑制值。8.根据权利要求1

7中任一项所述的方法,其特征在于,所述预先设置的非线性失真信号通过对所述远端参考信号进行全波整流获得。9.一种回声消除装置,其特征在于,包括:第一获取模块,被配置为获取对输入声音信号进行线性回声消除后的第一声音信号,以及对所述第一声音信号进行线性回声残留抑制后的第二声音信号,其中,所述输入声音信号包括所述输入声音信号包括远端参考信号和/或终端的麦...

【专利技术属性】
技术研发人员:胡宝俊贾永涛刘娟町李肖阳马凯池王林章
申请(专利权)人:北京小米松果电子有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1