一种抑制晚期混响的方法、装置及存储介质制造方法及图纸

技术编号:34046553 阅读:55 留言:0更新日期:2022-07-06 14:46
本公开涉及语音信号处理技术领域,公开了一种抑制晚期混响的方法、装置及存储介质,该方法为:通过神经网络对原始语音信号进行降噪处理,并基于降噪处理后的结果信号确定2范数权重系数,将2范数权重系数和原始语音信号对应的待处理语音信号输入到RLS权重预测误差多通道混响抑制算法中,得到滤波器系数,基于滤波器系数确定晚期混响估计值,待处理语音信号为时域内的原始语音信号对应的频域信号,将待处理语音信号和所述晚期混响估计值之间的差值,确定为目标语音信号,通过神经网络确定准确的2范数权重系数,进而得出准确的晚期混响估计值,并用待处理语音信号减去晚期混响估计值得到目标语音信号,从而起到抑制晚期混响的效果。效果。效果。

A method, device and storage medium for suppressing late reverberation

【技术实现步骤摘要】
一种抑制晚期混响的方法、装置及存储介质


[0001]本公开涉及语音信号处理
,提供了一种抑制晚期混响的方法、装置及存储介质。

技术介绍

[0002]随着越来越多的语音设备出现在各种场景中,诸如免提模式下工作的电子产品、电视电话会议中的语音识别系统、远程会议中的自动翻译系统和互动式电视等产品,语音设备采集到的语音信号不可避免的会被混响和噪声污染,如果混响(行业内通常是指晚期混响)比较严重,会导致语音设备无法正常发挥功能,即语音信号无法正常播放等。
[0003]现有的对晚期混响进行抑制的方法主要是先将语音信号分帧,再转换到频域,在频域内直接利用指数衰减模型估计晚期混响,然后结合QR

RLS算法对多通道混响信号进行抑制,但上述直接利用指数衰减模型的方式太过粗糙简单,估计出的晚期混响准确度不高,虽然某些场景下增加了带系数的谱减法,但该系数(行业内通常是指2范数权重系数)只能手动调整,计算过程费时费力。
[0004]综上,目前尚无有效的解决办法对噪声条件下语音信号中的晚期混响进行有效抑制。

技术实现思路

[0005]本公开实施例提供一种抑制晚期混响的方法、装置及存储介质,用以提升噪声环境下的语音信号的晚期混响的抑制效果。
[0006]本公开提供的具体技术方案如下:
[0007]第一方面,本公开实施例提供了一种抑制晚期混响的方法,包括:
[0008]通过神经网络对原始语音信号进行降噪处理,并基于降噪处理后的结果信号确定2范数权重系数;
[0009]将2范数权重系数和原始语音信号对应的待处理语音信号输入到RLS权重预测误差多通道混响抑制算法中,得到滤波器系数,并基于滤波器系数确定晚期混响估计值,其中,待处理语音信号为时域内的原始语音信号对应的频域信号;
[0010]将待处理语音信号和晚期混响估计值之间的差值,确定为目标语音信号。
[0011]可选地,参考信号的基于降噪处理后的结果信号确定2范数权重系数,包括:
[0012]将降噪处理后的结果信号从时域转换到频域,得到参考信号;
[0013]基于参考信号的幅度值,确定功率谱密度;
[0014]基于功率谱密度的平均值、参考信号的通道数和形态参数确定参考信号的2范数权重系数,其中,通道数和形态参数为参考信号的属性。
[0015]可选地,将降噪处理后的结果信号从时域转换到频域,得到参考信号,包括:
[0016]将降噪处理后的结果信号在时域按照指定步长进行分段处理,得到多个分段结果信号;
[0017]将各个分段结果信号与预设窗口进行相乘,得到多个窗口信号;
[0018]将各个窗口信号进行短时傅里叶变换,得到对应在频域的多个子参考信号;
[0019]基于各个子参考信号确定结果信号对应的频域信号,并将结果信号对应的频域信号作为参考信号。
[0020]可选地,原始语音信号对应的待处理语音信号通过以下方式确定:
[0021]将原始语音信号在时域按照指定步长进行分段处理,得到多个原始分段结果信号;
[0022]将各个原始分段结果信号与预设窗口进行相乘,得到多个原始窗口信号;
[0023]将各个原始窗口信号进行短时傅里叶变换,得到对应在频域的多个子原始参考信号,基于各个子原始参考信号确定原始语音信号对应的频域信号,并将原始语音信号对应的频域信号作为待处理语音信号。
[0024]可选地,基于滤波器系数确定晚期混响估计值,包括:
[0025]将滤波器系数进行转置,得到转置后的滤波器系数;
[0026]基于参考信号的延迟时间,确定信号缓存块,其中,信号缓存块包括参考信号的早期混响;
[0027]基于转置后的滤波器系数和信号缓存块,确定晚期混响估计值。
[0028]第二方面,本公开实施例还提供了一种抑制晚期混响的装置,包括:
[0029]系数确定单元,用于通过神经网络对原始语音信号进行降噪处理,并基于降噪处理后的结果信号确定2范数权重系数;
[0030]晚期混响确定单元,用于将2范数权重系数和原始语音信号对应的待处理语音信号输入到RLS权重预测误差多通道混响抑制算法中,得到滤波器系数,并基于滤波器系数确定晚期混响估计值,其中,待处理语音信号为时域内的原始语音信号对应的频域信号;
[0031]语音确定单元,用于将待处理语音信号和晚期混响估计值之间的差值,确定为目标语音信号。
[0032]可选地,基于降噪处理后的结果信号确定2范数权重系数,系数确定单元用于:
[0033]将降噪处理后的结果信号从时域转换到频域,得到参考信号;
[0034]基于参考信号的幅度值,确定功率谱密度;
[0035]基于功率谱密度的平均值、参考信号的通道数和形态参数确定参考信号的2范数权重系数,其中,通道数和形态参数为参考信号的属性。
[0036]可选地,将降噪处理后的结果信号从时域转换到频域,得到参考信号,晚期混响确定单元用于:
[0037]将降噪处理后的结果信号在时域按照指定步长进行分段处理,得到多个分段结果信号;
[0038]将各个分段结果信号与预设窗口进行相乘,得到多个窗口信号;
[0039]将各个窗口信号进行短时傅里叶变换,得到对应在频域的多个子参考信号;
[0040]基于各个子参考信号确定结果信号对应的频域信号,并将结果信号对应的频域信号作为参考信号。
[0041]可选地,原始语音信号对应的待处理语音信号通过以下方式确定:
[0042]将原始语音信号在时域按照指定步长进行分段处理,得到多个原始分段结果信
号;
[0043]将各个原始分段结果信号与预设窗口进行相乘,得到多个原始窗口信号;
[0044]将各个原始窗口信号进行短时傅里叶变换,得到对应在频域的多个子原始参考信号,基于各个子原始参考信号确定原始语音信号对应的频域信号,并将原始语音信号对应的频域信号作为待处理语音信号。
[0045]可选地,基于滤波器系数确定晚期混响估计值,晚期混响确定单元用于:
[0046]将滤波器系数进行转置,得到转置后的滤波器系数;
[0047]基于参考信号的延迟时间,确定信号缓存块,其中,信号缓存块包括参考信号的早期混响;
[0048]基于转置后的滤波器系数和信号缓存块,确定晚期混响估计值。
[0049]第三方面,一种智能终端,包括:
[0050]存储器,用于存储可执行指令;
[0051]处理器,用于读取并执行存储器中存储的可执行指令,以实现如第一方面任一项的方法。
[0052]第四方面,一种计算机可读存储介质,当所述存储介质中的指令由处理器执行时,使得所述处理器能够执行上述第一方面任一项所述的方法。
[0053]本公开有益效果如下:
[0054]综上所述,本公开实施例中,提供的一种抑制晚期混响的方法、装置及存储介质,该方法包括:通过本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种抑制晚期混响的方法,其特征在于,所述方法包括:通过神经网络对原始语音信号进行降噪处理,并基于降噪处理后的结果信号确定2范数权重系数;将所述2范数权重系数和原始语音信号对应的待处理语音信号输入到RLS权重预测误差多通道混响抑制算法中,得到滤波器系数,并基于所述滤波器系数确定晚期混响估计值,其中,所述待处理语音信号为时域内的所述原始语音信号对应的频域信号;将所述待处理语音信号和所述晚期混响估计值之间的差值,确定为目标语音信号。2.如权利要求1所述的方法,其特征在于,所述基于降噪处理后的结果信号确定2范数权重系数,包括:将降噪处理后的所述结果信号从时域转换到频域,得到所述参考信号;基于所述参考信号的幅度值,确定所述功率谱密度;基于所述功率谱密度的平均值、所述参考信号的通道数和形态参数确定参考信号的2范数权重系数,其中,所述通道数和所述形态参数为所述参考信号的属性。3.如权利要求2所述的方法,其特征在于,所述将降噪处理后的所述结果信号从时域转换到频域,得到所述参考信号,包括:将降噪处理后的所述结果信号在时域按照指定步长进行分段处理,得到多个分段结果信号;将各个所述分段结果信号与预设窗口进行相乘,得到多个窗口信号;将各个所述窗口信号进行短时傅里叶变换,得到对应在频域的多个子参考信号;基于各个所述子参考信号确定所述结果信号对应的频域信号,并将所述结果信号对应的频域信号作为所述参考信号。4.如权利要求3所述的方法,其特征在于,所述原始语音信号对应的待处理语音信号通过以下方式确定:将所述原始语音信号在时域按照所述指定步长进行分段处理,得到多个原始分段结果信号;将各个所述原始分段结果信号与所述预设窗口进行相乘,得到多个原始窗口信号;将各个所述原始窗口信号进行短时傅里叶变换,得到对应在频域的多个子原始参考信号,基于各个所述子原始参考信号确定所述原始语音信号对应的频域信号,并将所述原始语音信号对应的频域信号作为所述待处理语音信号。5.如权利要求1~4任一所述的方法,其特征在于,所述基于所述滤波器系数确定晚期混响估计值,包括:将所述滤波器系数进行转置,得到转置后的滤波...

【专利技术属性】
技术研发人员:刘克柱黄景标林聚财方瑞东陈庭威毛亚朋殷俊
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1