语音处理方法、装置、存储介质及电子设备制造方法及图纸

技术编号:29706486 阅读:16 留言:0更新日期:2021-08-17 14:36
本公开涉及一种语音处理方法、装置、存储介质及电子设备,包括:对采集到的唤醒音频的声源进行音区定位,确定目标音区;基于所述目标音区确定用于波束成形的目标参数值组,其中,用于波束成形的参数值组与所述音区一一对应;获取待处理音频;基于所述目标参数值组对所述待处理音频进行波束成形处理,得到目标音频。通过在确定出与唤醒音频对应的目标音区之后,利用与目标音区对应的目标参数值组对采集到的待处理音频进行波束成形处理,即,在波束成形处理时是利用与目标音区对应的目标参数值进行的,使得波束成形处理能够增强发出唤醒音频的用户的音频而削弱其他声音。

【技术实现步骤摘要】
语音处理方法、装置、存储介质及电子设备
本公开涉及音频处理
,具体地,涉及一种语音处理方法、装置、存储介质及电子设备。
技术介绍
语音处理被应用在各种各样的场合,例如,在视频会议场景中,需要对发言人的音频进行采集并减小其他音频对发音人音频的影响,若将发言人的音频以及其他音频一起发送给其他终端,那么在其他终端将难以听清发音人的音频内容。或者,在车载语音系统中,车载语音系统是一种提高驾驶安全性以及增强驾驶体验的智能语音系统,可以辅助驾驶员实现语音导航,语音播放音乐等功能,但是由于车辆内空间较小,驾驶员在与车载语音系统进行语音对话时,往往会被其他声音干扰,例如受到车内乘客交谈或电话声等的干扰,又如,受到车辆胎噪、风噪或者空调声等自然声的干扰,导致车载语音系统识别驾驶员的语音指令的正确性较低。因此,就需要对目标用户的音频进行增强处理而削弱其他声音。在相关技术中,为降低其他声音对目标用户音频的影响,常采用的技术方案是,采用了将音频采集空间划分为不同的音区,并在每一音区内对应设置采集声音的麦克风,进而根据每一麦克风采集的语音信息的时间从控制信号集合中确定目标控制语音,并对目标控制语音进行过滤降噪,加强目标控制语音的强度。然而,上述方式中是利用麦克风采集到语音信息的时间进行目标用户的确定的,但是若发言人与麦克风之间存在一定距离,且在该距离内还有其他用户在产生音频,那么该方法就难以从采集到的音频中准确地增强目标用户的音频而削弱其他声音。
技术实现思路
本公开的目的是提供一种车载语音识别方法、装置、存储介质及电子设备,以解决相关技术中难以从采集到的音频中准确地增强目标用户的音频而削弱其他声音的问题。为了实现上述目的,本公开实施例的第一方面,提供一种车载语音识别方法,所述方法包括:对采集到的唤醒音频的声源进行音区定位,确定目标音区;基于所述目标音区确定用于波束成形的目标参数值组,其中,用于波束成形的参数值组与所述音区一一对应;获取待处理音频;基于所述目标参数值组对所述待处理音频进行波束成形处理,得到目标音频。可选地,所述基于所述目标音区确定用于波束成形操作的目标参数值组,包括:获取参数值存储表,所述参数值存储表用于存储与各个音区对应的参数值组;利用所述目标音区查询参数值存储表,确定所述目标参数值组。可选地,所述获取参数值存储表,包括:在任一音区作为所述目标音区时,获取测试音频;利用至少一个预设步长在每种参数的数值范围内进行遍历,得到候选参数值组;利用所述候选参数值组对所述测试音频进行波束成形处理,得到候选音频;对所述候选音频进行语音识别测试,得到测试结果;基于对应于各个候选参数值组的测试结果,确定所述目标音区的目标参数值组,以得到所述参数值存储表。可选地,所述在任一音区作为所述目标音区时,获取测试音频,包括:在任一音区作为所述目标音区时,确定所述目标音区对应的目标语音接收装置;获取所述目标语音接收装置采集到的音频,得到所述测试音频。可选地,所述获取待处理音频,包括:利用所述目标音区,确定与所述目标音区对应的目标语音接收装置;获取所述目标语音接收装置采集到的音频,得到所述待处理音频。可选地,所述基于所述目标参数值组对所述待处理音频进行波束成形处理,得到目标音频,包括:对所述待处理音频进行回声消除;对回声消除后的待处理音频进行语音活动检测,得到用户音频;对所述用户音频进行降噪处理,并利用所述目标参数值组对降噪处理后的待处理音频进行webrtc波束成形处理,得到所述目标音频。可选地,所述基于所述目标参数值组对所述待处理音频进行波束成形处理,得到目标音频的步骤之后,包括:对所述目标音频进行语音识别,得到语音控制指令;基于所述语音控制指令,控制相应的执行机构执行对应的动作。本公开实施例的第二方面,提供一种语音处理装置,所述装置包括:定位模块,用于对采集到的唤醒音频的声源进行音区定位,确定目标音区;确定模块,用于基于所述目标音区确定用于波束成形的目标参数值组,其中,用于波束成形的参数值组与所述音区一一对应;获取模块,用于获取待处理音频;处理模块,用于基于所述目标参数值组对所述待处理音频进行波束成形处理,得到目标音频。可选地,所述确定模块,包括:获取单元,用于获取参数值存储表,所述参数值存储表用于存储与各个音区对应的参数值组;查询单元,用于利用所述目标音区查询参数值存储表,确定所述目标参数值组。可选地,所述获取单元包括:获取子单元,用于在任一音区作为所述目标音区时,获取测试音频;遍历子单元,用于利用至少一个预设步长在每种参数的数值范围内进行遍历,得到候选参数值组;处理子单元,用于利用所述候选参数值组对所述测试音频进行波束成形处理,得到候选音频;识别子单元,用于对所述候选音频进行语音识别测试,得到测试结果;确定子单元,用于基于对应于各个候选参数值组的测试结果,确定所述目标音区的目标参数值组,以得到所述参数值存储表。可选地,所述获取子单元,包括:第一子单元,用于在任一音区作为所述目标音区时,确定所述目标音区对应的目标语音接收装置;第二子单元,用于获取所述目标语音接收装置采集到的音频,得到所述测试音频。可选地,所述获取模块,包括:利用所述目标音区,确定与所述目标音区对应的目标语音接收装置;获取所述目标语音接收装置采集到的音频,得到所述待处理音频。可选地,所述处理模块,包括:回声消除单元,用于对所述待处理音频进行回声消除;活动检测单元,用于对回声消除后的待处理音频进行语音活动检测,得到用户音频;降噪单元,用于对所述用户音频进行降噪处理,并利用所述目标参数值组对降噪处理后的待处理音频进行webrtc波束成形处理,得到所述目标音频。可选地,所述语音处理装置,还包括:语音识别模块,用于对所述目标音频进行语音识别,得到语音控制指令;控制模块,用于基于所述语音控制指令,控制相应的执行机构执行对应的动作。本公开实施例的第三方面,提供一种电子设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行本公开第一方面任一项所述的语音处理方法。本公开实施例的第四方面,提供一种计算机可读存储介质,包括:所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使计算机执行本公开第一方面任一项所述的语音处理方法。上述技术方案,至少可以达到以下技术效果:通过对采集到的唤醒音频的声源进行音区定位,确定目标音区;基于目标音区确定用于波束成形的目标参数值组,其中,用于波束成形的参数值组与音区一一对应;获取待处理音频;基于目标参数值组对待处理音频本文档来自技高网...

【技术保护点】
1.一种语音处理方法,其特征在于,所述方法包括:/n对采集到的唤醒音频的声源进行音区定位,确定目标音区;/n基于所述目标音区确定用于波束成形的目标参数值组,其中,用于波束成形的参数值组与所述音区一一对应;/n获取待处理音频;/n基于所述目标参数值组对所述待处理音频进行波束成形处理,得到目标音频。/n

【技术特征摘要】
1.一种语音处理方法,其特征在于,所述方法包括:
对采集到的唤醒音频的声源进行音区定位,确定目标音区;
基于所述目标音区确定用于波束成形的目标参数值组,其中,用于波束成形的参数值组与所述音区一一对应;
获取待处理音频;
基于所述目标参数值组对所述待处理音频进行波束成形处理,得到目标音频。


2.根据权利要求1所述的方法,其特征在于,所述基于所述目标音区确定用于波束成形的目标参数值组,包括:
获取参数值存储表,所述参数值存储表用于存储与各个音区对应的参数值组;
利用所述目标音区查询参数值存储表,确定所述目标参数值组。


3.根据权利要求2所述的方法,其特征在于,所述获取参数值存储表,包括:
在任一音区作为所述目标音区时,获取测试音频;
利用至少一个预设步长在每种参数的数值范围内进行遍历,得到候选参数值组;
利用所述候选参数值组对所述测试音频进行波束成形处理,得到候选音频;
对所述候选音频进行语音识别测试,得到测试结果;
基于对应于各个候选参数值组的测试结果,确定所述目标音区的目标参数值组,以得到所述参数值存储表。


4.根据权利要3所述的方法,其特征在于,所述在任一音区作为所述目标音区时,获取测试音频,包括:
在任一音区作为所述目标音区时,确定所述目标音区对应的目标语音接收装置;
获取所述目标语音接收装置采集到的音频,得到所述测试音频。


5.根据权利要求1所述的方法,其特征在于,所述获取待处理音频,包括:
利用所述目标音区,确定与所述目标音区对应的目标语音接收装置;
获取所述目标语音接收装置采集到的音...

【专利技术属性】
技术研发人员:葛斯函马天泽尹路通
申请(专利权)人:镁佳北京科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1