多路语音识别方法、装置、设备及可读存储介质制造方法及图纸

技术编号：21435509 阅读：16 留言：0更新日期：2019-06-22 12:57

本发明专利技术实施例提供一种多路语音识别方法、装置、设备及可读存储介质。本发明专利技术实施例的方法，通过接收多路麦克风阵列采集的音频数据，对每路音频数据进行波束成形处理，得到每路音频数据中与对应音频采集区域对应的音频信号，削弱该路音频数据中其他方向上的音频信号；对多路音频信号进行干扰抑制处理得到每个音频采集区域对应语音信号，减少其他音频采集区域的噪音信号对该路语音信号的干扰，对各语音信号语音识别得到每个音频采集区域对应的语音识别结果，提高了语音识别的识别率；在多人同时讲话时，抑制各路语音信号间的相互干扰，得到每个音频采集位置对应的语音识别结果，提高了语音识别的效率和准确性。

全部详细技术资料下载

【技术实现步骤摘要】
多路语音识别方法、装置、设备及可读存储介质
本专利技术实施例涉及语音识别
，尤其涉及一种多路语音识别方法、装置、设备及可读存储介质。
技术介绍
目前，车辆上的车机都是只在前排设置一路双声道麦克风，包括左、右声道两个麦克风，主要用于采集正驾驶位附近的音频数据，通过对采集的音频数据进行语音识别，来识别司机向车机发出的指令等识别语。但是，如果车辆上坐在副驾驶位或者后排座位的乘客向车机发出识别语时，由于声源距离麦克风较远，麦克风采集的音频数据质量较差，导致语音识别率很低，尤其在多人同时讲识别语时，会造成混响，更加难以正确识别出识别语。
技术实现思路
本专利技术实施例提供一种多路语音识别方法、装置、设备及可读存储介质，用以解决现有技术中车辆上的语音识别方法的语音识别率很低的问题。本专利技术实施例的一个方面是提供一种多路语音识别方法，包括：接收多路麦克风阵列采集的音频数据，每路所述麦克风阵列指向车辆内的一个音频采集区域，用于采集一路音频数据；根据每路麦克风阵列相对于对应音频采集区域的位置，对每路所述音频数据进行波束成形处理，得到每路所述音频数据中与对应音频采集区域对应的音频信号；对多路所述音频信号进行干扰抑制处理，得到每个所述音频采集区域对应语音信号；对各所述音频采集区域对应的语音信号进行语音识别，得到每个所述音频采集区域对应的语音识别结果。本专利技术实施例的另一个方面是提供一种多路语音识别装置，包括：数据获取模块，用于接收多路麦克风阵列采集的音频数据，每路所述麦克风阵列指向车辆内的一个音频采集区域，用于采集一路音频数据；波束成形模块，用于根据每路麦克风阵列相对于对...

【技术保护点】
1.一种多路语音识别方法，其特征在于，包括：接收多路麦克风阵列采集的音频数据，每路所述麦克风阵列指向车辆内的一个音频采集区域，用于采集一路音频数据；根据每路麦克风阵列相对于对应音频采集区域的位置，对每路所述音频数据进行波束成形处理，得到每路所述音频数据中与对应音频采集区域对应的音频信号；对多路所述音频信号进行干扰抑制处理，得到每个所述音频采集区域对应语音信号；对各所述音频采集区域对应的语音信号进行语音识别，得到每个所述音频采集区域对应的语音识别结果。

【技术特征摘要】
1.一种多路语音识别方法，其特征在于，包括：接收多路麦克风阵列采集的音频数据，每路所述麦克风阵列指向车辆内的一个音频采集区域，用于采集一路音频数据；根据每路麦克风阵列相对于对应音频采集区域的位置，对每路所述音频数据进行波束成形处理，得到每路所述音频数据中与对应音频采集区域对应的音频信号；对多路所述音频信号进行干扰抑制处理，得到每个所述音频采集区域对应语音信号；对各所述音频采集区域对应的语音信号进行语音识别，得到每个所述音频采集区域对应的语音识别结果。2.根据权利要求1所述的方法，其特征在于，所述对各所述音频采集区域对应的语音信号进行语音识别，得到每个所述音频采集区域对应的语音识别结果，包括：并行地对各所述音频采集区域对应的语音信号进行语音识别，得到每个所述音频采集区域对应的语音识别结果。3.根据权利要求1所述的方法，其特征在于，所述对多路所述音频信号进行干扰抑制处理，得到每个所述音频采集区域对应语音信号，包括：分别将每路所述音频信号作为目标音频，对所述目标音频进行声源定位处理，确定所述目标音频的声源位置；根据所述目标音频的声源位置，判断所述目标音频中是否包含其他音频采集区域的声源发出的音频信号；若所述目标音频中包含其他音频采集区域的声源发出的音频信号，则从所述目标音频中去除所述其他音频采集区域对应的音频信号，得到所述目标音频对应音频采集区域所对应的语音信号。4.根据权利要求1所述的方法，其特征在于，所述根据每路麦克风阵列相对于对应音频采集区域的位置，对每路所述音频数据进行波束成形处理，得到每路所述音频数据中与对应音频采集区域对应的音频信号之前，还包括：获取每路麦克风阵列相对于对应音频采集区域的位置。5.根据权利要求4所述的方法，其特征在于，所述获取每路麦克风阵列相对于对应音频采集区域的位置，包括：对于任意一路麦克风阵列，接收该路麦克风阵列采集的对应音频采集区域的声源发出的定位音频；对所述定位音频进行声源定位处理，计算所述定...

【专利技术属性】
技术研发人员：陈建哲，彭汉迎，欧阳能钧，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人