一种语音信号去噪方法及装置制造方法及图纸

技术编号:30440644 阅读:32 留言:0更新日期:2021-10-24 18:28
本发明专利技术公开了一种语音信号去噪方法及装置,可以获得由麦克风阵列采集到的多路语音信号,多路语音信号中包括噪声,对多路语音信号进行声源定位,确定声源方位角,将位于目标方位角上的语音信号确定为噪声,目标方位角与声源方位角的角度偏差值不小于预设的角度偏差阈值,基于目标方位角与声源方位角的角度偏差值,确定相应的目标子带滤波器系数,基于目标子带滤波器系数,对位于目标方位角上的语音信号进行去噪处理。本发明专利技术可以在避免影响目标声源输出的语音信号的同时,实现对采集到的多路语音信号的有效去噪处理,有效提高音频去噪能力。力。力。

【技术实现步骤摘要】
一种语音信号去噪方法及装置


[0001]本专利技术涉及信号处理
,尤其涉及一种语音信号去噪方法及装置。

技术介绍

[0002]随着信号处理技术的提高,语音信号去噪技术不断提高。
[0003]当前,现有技术可以利用语音采集设备,在特定场所内对目标声源输出的语音信号进行采集、去噪和记录等处理。
[0004]但是,现有技术无法对采集到的语音信号进行有效去噪。

技术实现思路

[0005]鉴于上述问题,本专利技术提供一种克服上述问题或者至少部分地解决上述问题的语音信号去噪方法及装置,技术方案如下:
[0006]一种语音信号去噪方法,包括:
[0007]获得由麦克风阵列采集到的多路语音信号,所述多路语音信号中包括噪声;
[0008]对所述多路语音信号进行声源定位,确定声源方位角;
[0009]将位于目标方位角上的所述语音信号确定为噪声,所述目标方位角与所述声源方位角的角度偏差值不小于预设的角度偏差阈值;
[0010]基于所述目标方位角与所述声源方位角的角度偏差值,确定相应的目标子带滤波器系数;
[0011]基于所述目标子带滤波器系数,对所述位于目标方位角上的所述语音信号进行去噪处理。
[0012]可选的,所述对所述多路语音信号进行声源定位,确定声源方位角,包括:
[0013]结合麦克风阵列声源定位技术和图像识别技术,对所述多路语音信号进行声源定位,确定所述声源方位角。
[0014]可选的,所述结合麦克风阵列声源定位技术和图像识别技术,对所述多路语音信号进行声源定位,确定所述声源方位角,包括:
[0015]获得由摄像头拍摄的包含有说话人的目标图像,利用图像识别技术对所述目标图像中的所述说话人进行人体关键点识别,确定所述说话人的人体关键点坐标,基于所述人体关键点坐标确定所述说话人的第一方位角;
[0016]利用麦克风阵列声源定位技术,对所述多路语音信号进行声源定位,确定目标声源的第二方位角;
[0017]判断所述第一方位角与所述第二方位角是否相匹配,如果是,则确定所述说话人为所述目标声源,基于所述第一方位角和所述第二方位角确定所述声源方位角。
[0018]可选的,所述获得由摄像头拍摄的包含有说话人的目标图像,利用图像识别技术对所述目标图像中的所述说话人进行人体关键点识别,确定所述说话人的人体关键点坐标,基于所述人体关键点坐标确定所述说话人的第一方位角,包括:
[0019]获得深度摄像头拍摄的包含有所述说话人的所述目标图像,在所述目标图像中确定所述说话人至所述深度摄像头的深度距离;
[0020]利用人体姿态估计技术,在所述目标图像中对所述说话人的人体区域进行人体关键点识别,确定所述说话人的头部坐标;
[0021]基于所述深度距离和所述头部坐标,确定所述第一方位角。
[0022]可选的,所述第一方位角是在摄像头坐标系中获得的,所述第二方位角是在麦克风阵列坐标系中获得的,所述判断所述第一方位角与所述第二方位角是否相匹配,包括:
[0023]对所述第一方位角进行坐标系变换,获得所述第一方位角在所述麦克风阵列坐标系中对应的第三方位角;
[0024]比较所述第三方位角与所述第二方位角的差值是否不大于预设的方位角偏差阈值,如果是,则确定所述第一方位角与所述第二方位角相匹配;
[0025]所述基于所述第一方位角和所述第二方位角确定所述声源方位角,包括:
[0026]基于所述第三方位角和所述第二方位角确定所述声源方位角。
[0027]可选的,所述基于所述目标方位角与所述声源方位角的角度偏差值,确定相应的目标子带滤波器系数,包括:
[0028]将所述目标方位角与所述声源方位角输入至子带滤波器系数计算模型中,将所述子带滤波器系数计算模型输出的子带滤波系数确定为所述目标子带滤波器系数;其中:
[0029]所述子带滤波器系数计算模型为:
[0030]h
voice
(f
i
)=(0.5+0.5cos(θ(f
i
)

θ
voice
))
10

[0031]其中,i为所述多路语音信号的频域中频率谱线的序号,f
i
是序号为i的频率谱线对应的频率,h
voice
(fi)是频率f
i
对应的子带滤波器系数,θ(fi)是频率f
i
对应的所述目标方位角,θ
voice
为所述声源方位角。
[0032]可选的,所述基于所述目标子带滤波器系数,对所述位于目标方位角上的所述语音信号进行去噪处理,包括:
[0033]将所述目标子带滤波器系数和所述位于目标方位角上的所述语音信号,输入至去噪计算模型中,获得所述去噪计算模型输出的去噪后语音信号;其中,所述去噪计算模型为:
[0034]y(f
i
)=x(f
i
)
·
h
voice
(f
i
);
[0035]其中,y(fi)为去噪后语音信号,x(fi)为位于所述目标方位角上的所述语音信号。
[0036]可选的,所述头部坐标包括头部横坐标,所述基于所述深度距离和所述头部坐标,确定所述第一方位角,包括:
[0037]将所述深度距离和所述头部横坐标输入至方位角计算模型中,将所述方位角计算模型输出的方位角确定为所述第一方位角;其中,所述方位角计算模型为:
[0038][0039]其中,θ1为所述第一方位角,x1为所述头部横坐标,d为所述深度距离。
[0040]一种语音信号去噪装置,包括:第一获得单元、第一定位单元、第一确定单元、第二确定单元、第三确定单元和去噪处理单元,其中:
[0041]所述第一获得单元,被配置为执行:获得由麦克风阵列采集到的多路语音信号,所
述多路语音信号中包括噪声;
[0042]所述第一定位单元,被配置为执行:对所述多路语音信号进行声源定位;
[0043]所述第一确定单元,被配置为执行:确定声源方位角;
[0044]所述第二确定单元,被配置为执行:将位于目标方位角上的所述语音信号确定为噪声,所述目标方位角与所述声源方位角的角度偏差值不小于预设的角度偏差阈值;
[0045]所述第三确定单元,被配置为执行:基于所述目标方位角与所述声源方位角的角度偏差值,确定相应的目标子带滤波器系数;
[0046]所述去噪处理单元,被配置为执行:基于所述目标子带滤波器系数,对所述位于目标方位角上的所述语音信号进行去噪处理。
[0047]可选的,所述第一定位单元,被配置为执行:
[0048]结合麦克风阵列声源定位技术和图像识别技术,对所述多路语音信号进行声源定位。
[0049]可选的,所述第一定位单元,包括:第二获得单元、第一识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音信号去噪方法,其特征在于,包括:获得由麦克风阵列采集到的多路语音信号,所述多路语音信号中包括噪声;对所述多路语音信号进行声源定位,确定声源方位角;将位于目标方位角上的所述语音信号确定为噪声,所述目标方位角与所述声源方位角的角度偏差值不小于预设的角度偏差阈值;基于所述目标方位角与所述声源方位角的角度偏差值,确定相应的目标子带滤波器系数;基于所述目标子带滤波器系数,对所述位于目标方位角上的所述语音信号进行去噪处理。2.根据权利要求1所述的方法,其特征在于,所述对所述多路语音信号进行声源定位,确定声源方位角,包括:结合麦克风阵列声源定位技术和图像识别技术,对所述多路语音信号进行声源定位,确定所述声源方位角。3.根据权利要求2所述的方法,其特征在于,所述结合麦克风阵列声源定位技术和图像识别技术,对所述多路语音信号进行声源定位,确定所述声源方位角,包括:获得由摄像头拍摄的包含有说话人的目标图像,利用图像识别技术对所述目标图像中的所述说话人进行人体关键点识别,确定所述说话人的人体关键点坐标,基于所述人体关键点坐标确定所述说话人的第一方位角;利用麦克风阵列声源定位技术,对所述多路语音信号进行声源定位,确定目标声源的第二方位角;判断所述第一方位角与所述第二方位角是否相匹配,如果是,则确定所述说话人为所述目标声源,基于所述第一方位角和所述第二方位角确定所述声源方位角。4.根据权利要求3所述的方法,其特征在于,所述获得由摄像头拍摄的包含有说话人的目标图像,利用图像识别技术对所述目标图像中的所述说话人进行人体关键点识别,确定所述说话人的人体关键点坐标,基于所述人体关键点坐标确定所述说话人的第一方位角,包括:获得深度摄像头拍摄的包含有所述说话人的所述目标图像,在所述目标图像中确定所述说话人至所述深度摄像头的深度距离;利用人体姿态估计技术,在所述目标图像中对所述说话人的人体区域进行人体关键点识别,确定所述说话人的头部坐标;基于所述深度距离和所述头部坐标,确定所述第一方位角。5.根据权利要求3或4所述的方法,其特征在于,所述第一方位角是在摄像头坐标系中获得的,所述第二方位角是在麦克风阵列坐标系中获得的,所述判断所述第一方位角与所述第二方位角是否相匹配,包括:对所述第一方位角进行坐标系变换,获得所述第一方位角在所述麦克风阵列坐标系中对应的第三方位角;比较所述第三方位角与所述第二方位角的差值是否不大于预设的方位角偏差阈值,如果是,则确定所述第一方位角与所述第二方位角相匹配;所述基于所述第一方位角和所述第二方位角确定所述声源方位角,包括:
基于所述第三方位角和所述第二方位角确定所述声源方位角。6.根据权利要求1所述的方法,其特征在于,所述基于所述目标方位角与所述声源方位角的角度偏差值,确定相应的目标子带滤波器系数,包括:将所述目标方位角与所述声源方位角输入至子带滤波器系数计算模型中,将所述子带滤波器系数计算模...

【专利技术属性】
技术研发人员:郝昊李骊
申请(专利权)人:北京华捷艾米科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1