通话降噪方法及相关装置制造方法及图纸

技术编号:39289360 阅读:21 留言:0更新日期:2023-11-07 10:58
本申请涉及音频技术领域,提供一种通话降噪方法及相关装置,用以提升回声去除效果,同时降低计算复杂度,该方法包括:对各路扬声器信号进行合并,获得远端参考信号,基于远端参考信号和各路初始语音的频域特征,采用目标参数预测模型,确定目标去噪参数,并基于根据目标去噪参数确定的回声信息进行回声去除,最后对各路回声去除语音进行合并,并对合并语音进行降噪处理,获得目标语音。采用机器学习模型进行参数预测,可以降低计算复杂度,减轻计算压力,同时模提升回声去除效果。同时模提升回声去除效果。同时模提升回声去除效果。

【技术实现步骤摘要】
通话降噪方法及相关装置


[0001]本申请涉及音频
,提供一种通话降噪方法及相关装置。

技术介绍

[0002]随着计算机技术的不断发展,在车载通话过程中,通常采用车载蓝牙连接手机蓝牙的方式实现免提通话,然而,免提通话中存在噪音大、回声大的问题。
[0003]相关技术中,通常采用基于信号和基于神经网络的处理方式进行噪声和回声的去除。
[0004]在基于信号的处理方式中,针对获取到的来自多路麦克风的通话语音,首先,通过多音区技术定位目标通话语音,采用归一化最小均方(Normalized Least Mean Square,NLSM)、近邻传播算法(Affinity Propagation,AP)、卡尔曼滤波等信号处理算法,对目标通话语音进行回声消除及降噪,获得处理后的通话语音,并将处理后的通话语音传输至对话终端。
[0005]然而,由于回声路径(即扬声器声音传入麦克风的路径)变化较快,信号处理算法难以准确定位车内的回声路径,导致回声去除效果较差。此外,采用多音区技术定位声源,存在定位不准确导致语音丢失的情况,影响通话质本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种通话降噪方法,其特征在于,所述方法包括:获取通过至少一个麦克风分别采集的初始语音,以及获取至少一个扬声器的扬声器信号,并对获取的至少一路扬声器信号进行合并,获得远端参考信号;采用目标参数预测模型,基于获取的至少一路初始语音,分别结合所述远端参考信号,确定所述至少一路初始语音各自对应的目标去噪参数,所述目标去噪参数为用于降低回声的算法中的参数,并基于所述用于降低回声的算法和确定的至少一个目标去噪参数,确定至少一路初始语音各自的回声信息;基于所述至少一路初始语音各自的回声信息,分别对所述至少一路初始语音进行回声去除,获得相应的回声去除语音,并对获得的至少一路回声去除语音进行合并,获得合并语音;对所述合并语音进行降噪处理,获得目标语音,并将所述目标语音传输至对话终端。2.如权利要求1所述的方法,其特征在于,所述采用目标参数预测模型,基于获取的至少一路初始语音,分别结合所述远端参考信号,确定所述至少一路初始语音各自对应的目标去噪参数,包括:按照预设的滤波器阶数,基于获取的至少一路初始语音和所述远端参考信号,获得至少一路初始语音各自的频域特征;将获得的至少一路频域特征分别输入至目标参数预测模型中,获得所述至少一路初始语音各自对应的目标去噪参数。3.如权利要求2所述的方法,其特征在于,每个频域特征包含实部特征和虚部特征,所述目标参数预测模型中包含实部子模型和虚部子模型;则所述将获得的至少一路频域特征分别输入至目标参数预测模型中,获得所述至少一路初始语音各自对应的目标去噪参数,包括:针对获得的至少一路频域特征中的每一路频域特征,分别执行以下操作:将一路频域特征的实部特征输入至所述实部子模型,获得所述实部特征对应的实部参数,并将所述一路频域特征的虚部特征输入至所述虚部子模型,获得所述虚部特征对应的虚部参数,以及基于所述实部参数和所述虚部参数,获得一路初始语音对应的目标去噪参数。4.如权利要求1、2或3所述的方法,其特征在于,所述对所述合并语音进行降噪处理,获得目标语音,包括:将所述合并语音输入至目标降噪模型中,获得目标语音;其中,所述目标降噪模型是基于各训练样本,对初始降噪模型进行迭代训练得到,在每次迭代过程中,执行以下操作:按照预设的多种帧长,对获取的一个训练样本进行分帧处理,获得所述多种帧长各自对应的带噪语音,并分别对获得的多个带噪语音进行降噪处理,获得相应的去噪语音;基于获得的多个带噪语音各自对应的干净语音和去噪语音,确定模型损失,以及基于所述模型损失进行模型参数调整。5.如权利要求4所述的方法,其特征在于,所述分别对获得的多个带噪语音进行降噪处理,获得相应的去噪语音,包括:分别对获得的多个带噪语音进行时频信息提取,获得所述多个带噪语音各自对应的初始时频信息;
分别对获得的多个初始时频信息进行编解码处理,获得相应的降噪时频信息;基于所述多个带噪语音各自的相位信息,结合相应的降噪时频信息,获得相应的去噪语音。6.如权利要求5所述的方法,其特征在于,所述分别对获得的多个初始时频信息进行编解码处理,获得相应的降噪时频信息,包括:分别对获得的多个初始时频...

【专利技术属性】
技术研发人员:崔国辉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1