多路语音识别方法、装置、设备及可读存储介质制造方法及图纸

技术编号:21435509 阅读:16 留言:0更新日期:2019-06-22 12:57
本发明专利技术实施例提供一种多路语音识别方法、装置、设备及可读存储介质。本发明专利技术实施例的方法,通过接收多路麦克风阵列采集的音频数据,对每路音频数据进行波束成形处理,得到每路音频数据中与对应音频采集区域对应的音频信号,削弱该路音频数据中其他方向上的音频信号;对多路音频信号进行干扰抑制处理得到每个音频采集区域对应语音信号,减少其他音频采集区域的噪音信号对该路语音信号的干扰,对各语音信号语音识别得到每个音频采集区域对应的语音识别结果,提高了语音识别的识别率;在多人同时讲话时,抑制各路语音信号间的相互干扰,得到每个音频采集位置对应的语音识别结果,提高了语音识别的效率和准确性。

【技术实现步骤摘要】
多路语音识别方法、装置、设备及可读存储介质
本专利技术实施例涉及语音识别
,尤其涉及一种多路语音识别方法、装置、设备及可读存储介质。
技术介绍
目前,车辆上的车机都是只在前排设置一路双声道麦克风,包括左、右声道两个麦克风,主要用于采集正驾驶位附近的音频数据,通过对采集的音频数据进行语音识别,来识别司机向车机发出的指令等识别语。但是,如果车辆上坐在副驾驶位或者后排座位的乘客向车机发出识别语时,由于声源距离麦克风较远,麦克风采集的音频数据质量较差,导致语音识别率很低,尤其在多人同时讲识别语时,会造成混响,更加难以正确识别出识别语。
技术实现思路
本专利技术实施例提供一种多路语音识别方法、装置、设备及可读存储介质,用以解决现有技术中车辆上的语音识别方法的语音识别率很低的问题。本专利技术实施例的一个方面是提供一种多路语音识别方法,包括:接收多路麦克风阵列采集的音频数据,每路所述麦克风阵列指向车辆内的一个音频采集区域,用于采集一路音频数据;根据每路麦克风阵列相对于对应音频采集区域的位置,对每路所述音频数据进行波束成形处理,得到每路所述音频数据中与对应音频采集区域对应的音频信号;对多路所述音频信号进行干扰抑制处理,得到每个所述音频采集区域对应语音信号;对各所述音频采集区域对应的语音信号进行语音识别,得到每个所述音频采集区域对应的语音识别结果。本专利技术实施例的另一个方面是提供一种多路语音识别装置,包括:数据获取模块,用于接收多路麦克风阵列采集的音频数据,每路所述麦克风阵列指向车辆内的一个音频采集区域,用于采集一路音频数据;波束成形模块,用于根据每路麦克风阵列相对于对应音频采集区域的位置,对每路所述音频数据进行波束成形处理,得到每路所述音频数据中与对应音频采集区域对应的音频信号;干扰抑制处理模块,用于对多路所述音频信号进行干扰抑制处理,得到每个所述音频采集区域对应语音信号;语音识别模块,用于对各所述音频采集区域对应的语音信号进行语音识别,得到每个所述音频采集区域对应的语音识别结果。本专利技术实施例的另一个方面是提供一种多路语音识别设备,包括:存储器,处理器,以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时实现上述所述的多路语音识别方法。本专利技术实施例的另一个方面是提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述所述的多路语音识别方法。本专利技术实施例提供的多路语音识别方法、装置、设备及可读存储介质,通过接收多路麦克风阵列采集的音频数据,每路所述麦克风阵列指向车辆内的一个音频采集区域,用于采集一路音频数据;根据每路麦克风阵列相对于对应音频采集区域的位置,对每路所述音频数据进行波束成形处理,得到每路所述音频数据中与对应音频采集区域对应的音频信号,削弱该路音频数据中其他方向上的音频信号,实现对其他方向上音频信号的压制;然后对多路所述音频信号进行干扰抑制处理,得到每个所述音频采集区域对应语音信号,进一步减少其他音频采集区域的噪音信号对该路语音信号的干扰,得到更为干净的音频采集区域对应的语音信号;对各所述音频采集区域对应的语音信号进行语音识别,得到每个所述音频采集区域对应的语音识别结果;实现了无论声源位于车辆哪个音频采集区域,均有对应的一路麦克风阵列可以准确地采集该音频数据,并得到准确的语音识别结果,提高了语音识别的识别率;并且在多人在不同位置同时讲话时,能够抑制各路语音信号之间的相互干扰,识别出每个音频采集位置对应的语音识别结果,大大提高了语音识别的效率和准确性。附图说明图1为本专利技术实施例一提供的多路语音识别方法流程图;图2为本专利技术实施例二提供的多路语音识别方法流程图;图3为本专利技术实施例三提供的多路语音识别装置的结构示意图;图4为本专利技术实施例五提供的多路语音识别设备的结构示意图。通过上述附图,已示出本专利技术明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本专利技术实施例构思的范围,而是通过参考特定实施例为本领域技术人员说明本专利技术的概念。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本专利技术实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本专利技术实施例的一些方面相一致的装置和方法的例子。本专利技术实施例所涉及的术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。在以下各实施例的描述中,“多个”的含义是两个以上,除非另有明确具体的限定。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本专利技术的实施例进行描述。实施例一图1为本专利技术实施例一提供的多路语音识别方法流程图。本专利技术实施例针对现有技术中车辆上的语音识别方法的语音识别率很低的问题,提供了多路语音识别方法。本实施例中的方法应用于语音识别设备,该语音识别设备可以是安装与车辆上的车载终端设备,或者可以能够与车辆上的车载终端设备进行通信,并进行语音识别的计算机设备,在其他实施例中,该方法还可应用于其他设备,本实施例以语音识别设备为例进行示意性说明。如图1所示,该方法具体步骤如下:步骤S101、接收多路麦克风阵列采集的音频数据,每路麦克风阵列指向车辆内的一个音频采集区域,用于采集一路音频数据。本专利技术实施例应用于能够进行语音识别车辆,该车辆内通常设置有多个座位,例如正驾驶座位、副驾驶座位、以及其他座位等,车辆内安装有多路麦克风阵列,每路麦克风阵列指向一个音频采集区域,用于采集指向的音频采集区域的音频数据。每个音频采集区域对应于一个座位所在的位置,音频采集区域与车辆内的座位一一对应,也就是,每路麦克风阵列用于指向一个座位,麦克风阵列与车辆内的座位对应设置。例如,对于四座的自动驾驶车辆,在车辆内安装分别指向四个座位的四路麦克风阵列。本实施例中,在进行语音识别时,麦克风阵列可以实时地采集音频数据,并将采集的音频数据发送给语音识别设备。语音识别设备可以接收到各路麦克风阵列采集的音频数据。其中,每路音频数据可以包括采集该路音频数据的麦克风阵列的标识,以区分各路音频数据。步骤S102、根据每路麦克风阵列相对于对应音频采集区域的位置,对每路音频数据进行波束成形处理,得到每路音频数据中与对应音频采集区域对应的音频信号。其中,每路麦克风阵列对应的音频采集区域是指:该路麦克风阵列所指向的音频采集区域。每路语音数据对应的音频采集区域是指:采集该音频数据的麦克风阵列所指向的音频采集区域。该步骤中,在接收到多路音频数据之后,分别根据每路麦克风阵列相对于其所指向的音频采集区域的位置,通过波束成形(beamforming)技术,对该路麦克风阵列采集的一路音频数据进行波束成形处理,得到该路音频数据中与该路音频数据对应的音频采集区域对应的音频信号,削弱该路音频数据中其他方向上的音频信号,实现对其他方向上音频信号的压制。该步骤中,采用波束成形技术,通过对每路音频数据进行波束成形处理,得到每路音频数据中与对应音频采集区域对应的音频信号,也即是得到各个音频采集区域对本文档来自技高网...

【技术保护点】
1.一种多路语音识别方法,其特征在于,包括:接收多路麦克风阵列采集的音频数据,每路所述麦克风阵列指向车辆内的一个音频采集区域,用于采集一路音频数据;根据每路麦克风阵列相对于对应音频采集区域的位置,对每路所述音频数据进行波束成形处理,得到每路所述音频数据中与对应音频采集区域对应的音频信号;对多路所述音频信号进行干扰抑制处理,得到每个所述音频采集区域对应语音信号;对各所述音频采集区域对应的语音信号进行语音识别,得到每个所述音频采集区域对应的语音识别结果。

【技术特征摘要】
1.一种多路语音识别方法,其特征在于,包括:接收多路麦克风阵列采集的音频数据,每路所述麦克风阵列指向车辆内的一个音频采集区域,用于采集一路音频数据;根据每路麦克风阵列相对于对应音频采集区域的位置,对每路所述音频数据进行波束成形处理,得到每路所述音频数据中与对应音频采集区域对应的音频信号;对多路所述音频信号进行干扰抑制处理,得到每个所述音频采集区域对应语音信号;对各所述音频采集区域对应的语音信号进行语音识别,得到每个所述音频采集区域对应的语音识别结果。2.根据权利要求1所述的方法,其特征在于,所述对各所述音频采集区域对应的语音信号进行语音识别,得到每个所述音频采集区域对应的语音识别结果,包括:并行地对各所述音频采集区域对应的语音信号进行语音识别,得到每个所述音频采集区域对应的语音识别结果。3.根据权利要求1所述的方法,其特征在于,所述对多路所述音频信号进行干扰抑制处理,得到每个所述音频采集区域对应语音信号,包括:分别将每路所述音频信号作为目标音频,对所述目标音频进行声源定位处理,确定所述目标音频的声源位置;根据所述目标音频的声源位置,判断所述目标音频中是否包含其他音频采集区域的声源发出的音频信号;若所述目标音频中包含其他音频采集区域的声源发出的音频信号,则从所述目标音频中去除所述其他音频采集区域对应的音频信号,得到所述目标音频对应音频采集区域所对应的语音信号。4.根据权利要求1所述的方法,其特征在于,所述根据每路麦克风阵列相对于对应音频采集区域的位置,对每路所述音频数据进行波束成形处理,得到每路所述音频数据中与对应音频采集区域对应的音频信号之前,还包括:获取每路麦克风阵列相对于对应音频采集区域的位置。5.根据权利要求4所述的方法,其特征在于,所述获取每路麦克风阵列相对于对应音频采集区域的位置,包括:对于任意一路麦克风阵列,接收该路麦克风阵列采集的对应音频采集区域的声源发出的定位音频;对所述定位音频进行声源定位处理,计算所述定...

【专利技术属性】
技术研发人员:陈建哲彭汉迎欧阳能钧
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1