【技术实现步骤摘要】
一种语音信号去噪方法及装置
[0001]本专利技术涉及信号处理
,尤其涉及一种语音信号去噪方法及装置。
技术介绍
[0002]随着信号处理技术的提高,语音信号去噪技术不断提高。
[0003]当前,现有技术可以利用语音采集设备,在特定场所内对目标声源输出的语音信号进行采集、去噪和记录等处理。
[0004]但是,现有技术无法对采集到的语音信号进行有效去噪。
技术实现思路
[0005]鉴于上述问题,本专利技术提供一种克服上述问题或者至少部分地解决上述问题的语音信号去噪方法及装置,技术方案如下:
[0006]一种语音信号去噪方法,包括:
[0007]获得由麦克风阵列采集到的多路语音信号,所述多路语音信号中包括噪声;
[0008]对所述多路语音信号进行声源定位,确定声源方位角;
[0009]将位于目标方位角上的所述语音信号确定为噪声,所述目标方位角与所述声源方位角的角度偏差值不小于预设的角度偏差阈值;
[0010]基于所述目标方位角与所述声源方位角的角度偏差值,确定相应的目标子带滤波器系数;
[0011]基于所述目标子带滤波器系数,对所述位于目标方位角上的所述语音信号进行去噪处理。
[0012]可选的,所述对所述多路语音信号进行声源定位,确定声源方位角,包括:
[0013]结合麦克风阵列声源定位技术和图像识别技术,对所述多路语音信号进行声源定位,确定所述声源方位角。
[0014]可选的,所述结合麦克风阵列声源定位技术和 ...
【技术保护点】
【技术特征摘要】
1.一种语音信号去噪方法,其特征在于,包括:获得由麦克风阵列采集到的多路语音信号,所述多路语音信号中包括噪声;对所述多路语音信号进行声源定位,确定声源方位角;将位于目标方位角上的所述语音信号确定为噪声,所述目标方位角与所述声源方位角的角度偏差值不小于预设的角度偏差阈值;基于所述目标方位角与所述声源方位角的角度偏差值,确定相应的目标子带滤波器系数;基于所述目标子带滤波器系数,对所述位于目标方位角上的所述语音信号进行去噪处理。2.根据权利要求1所述的方法,其特征在于,所述对所述多路语音信号进行声源定位,确定声源方位角,包括:结合麦克风阵列声源定位技术和图像识别技术,对所述多路语音信号进行声源定位,确定所述声源方位角。3.根据权利要求2所述的方法,其特征在于,所述结合麦克风阵列声源定位技术和图像识别技术,对所述多路语音信号进行声源定位,确定所述声源方位角,包括:获得由摄像头拍摄的包含有说话人的目标图像,利用图像识别技术对所述目标图像中的所述说话人进行人体关键点识别,确定所述说话人的人体关键点坐标,基于所述人体关键点坐标确定所述说话人的第一方位角;利用麦克风阵列声源定位技术,对所述多路语音信号进行声源定位,确定目标声源的第二方位角;判断所述第一方位角与所述第二方位角是否相匹配,如果是,则确定所述说话人为所述目标声源,基于所述第一方位角和所述第二方位角确定所述声源方位角。4.根据权利要求3所述的方法,其特征在于,所述获得由摄像头拍摄的包含有说话人的目标图像,利用图像识别技术对所述目标图像中的所述说话人进行人体关键点识别,确定所述说话人的人体关键点坐标,基于所述人体关键点坐标确定所述说话人的第一方位角,包括:获得深度摄像头拍摄的包含有所述说话人的所述目标图像,在所述目标图像中确定所述说话人至所述深度摄像头的深度距离;利用人体姿态估计技术,在所述目标图像中对所述说话人的人体区域进行人体关键点识别,确定所述说话人的头部坐标;基于所述深度距离和所述头部坐标,确定所述第一方位角。5.根据权利要求3或4所述的方法,其特征在于,所述第一方位角是在摄像头坐标系中获得的,所述第二方位角是在麦克风阵列坐标系中获得的,所述判断所述第一方位角与所述第二方位角是否相匹配,包括:对所述第一方位角进行坐标系变换,获得所述第一方位角在所述麦克风阵列坐标系中对应的第三方位角;比较所述第三方位角与所述第二方位角的差值是否不大于预设的方位角偏差阈值,如果是,则确定所述第一方位角与所述第二方位角相匹配;所述基于所述第一方位角和所述第二方位角确定所述声源方位角,包括:
基于所述第三方位角和所述第二方位角确定所述声源方位角。6.根据权利要求1所述的方法,其特征在于,所述基于所述目标方位角与所述声源方位角的角度偏差值,确定相应的目标子带滤波器系数,包括:将所述目标方位角与所述声源方位角输入至子带滤波器系数计算模型中,将所述子带滤波器系数计算模...
【专利技术属性】
技术研发人员:郝昊,李骊,
申请(专利权)人:北京华捷艾米科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。