语音识别方法、装置、设备及存储介质制造方法及图纸

技术编号：20162401 阅读：24 留言：0更新日期：2019-01-19 00:15

本申请实施例提供一种语音识别方法、装置、设备及存储介质，通过获取终端设备上搭载的音频采集设备采集获得的语音信号，以及在采集获得该语音信号时终端设备所在的第一区域，采用预先存储的与第一区域对应的第一语音识别模型以及预先设定的所有区域通用的第二语音识别模型对语音信号进行语音识别处理，从而基于第一语音识别模型的第一识别结果和第二语音识别模型的第二识别结果，确定并输出目标输出的识别结果。本申请实施例提供的技术方案能够提高语音识别的准确性，提高用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法、装置、设备及存储介质
本申请实施例涉及语音识别
，尤其涉及一种语音识别方法、装置、设备及存储介质。
技术介绍
在目前的语音识别场景中通常采用一个通用的语言模型来对不同地域不同发音习惯用户的语音请求进行识别。以地图场景为例，在地图场景中通常使用一个训练自所有地名的语言模型对不同地域来源的语音请求进行解码识别。但是实际情况是，不同城市的地名/建筑名称/道路名称往往存在同音不同字的情况，同一个发音经常对应不同城市的街道(如海桐路(上海)和海铜路(重庆))、酒店(如爱俪轩(上海)和爱丽轩(廊坊))、建筑等，使得语音识别系统不确定哪个识别结果是用户目标输入的结果,只能呈现给用户在统计量上输出频率较高的识别结果,然而输出频率较高的识别结果不一定就是用户目标输入的结果，从而容易出现识别错误的情况，用户体验较差。
技术实现思路
本申请实施例提供一种语音识别方法、装置、设备及存储介质，用以提高语音识别的准确性，尤其是提高地图场景下语音识别的准确性。本申请实施例第一方面提供一种语音识别方法，包括：获取终端设备上搭载的音频采集设备采集获得的语音信号，以及获取在采集获得所述语音信号时所述终端设备所在的第一区域；采用预先存储的与所述第一区域对应的第一语音识别模型以及预先设定的所有区域通用的第二语音识别模型，对所述语音信号进行语音识别处理，其中所述第一语音识别模型是基于所述第一区域中的语音样本训练获得的；基于所述第一语音识别模型的第一识别结果和所述第二语音识别模型的第二识别结果，确定目标输出的识别结果。本申请实施例第二方面提供一种语音识别装置，包括：获取模块，用于获取...

【技术保护点】
1.一种语音识别方法，其特征在于，包括：获取终端设备上搭载的音频采集设备采集获得的语音信号，以及获取在采集获得所述语音信号时所述终端设备所在的第一区域；采用预先存储的与所述第一区域对应的第一语音识别模型以及预先设定的所有区域通用的第二语音识别模型，对所述语音信号进行语音识别处理，其中所述第一语音识别模型是基于所述第一区域中的语音样本训练获得的；基于所述第一语音识别模型的第一识别结果和所述第二语音识别模型的第二识别结果，确定目标输出的识别结果。

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：获取终端设备上搭载的音频采集设备采集获得的语音信号，以及获取在采集获得所述语音信号时所述终端设备所在的第一区域；采用预先存储的与所述第一区域对应的第一语音识别模型以及预先设定的所有区域通用的第二语音识别模型，对所述语音信号进行语音识别处理，其中所述第一语音识别模型是基于所述第一区域中的语音样本训练获得的；基于所述第一语音识别模型的第一识别结果和所述第二语音识别模型的第二识别结果，确定目标输出的识别结果。2.根据权利要求1所述的方法，其特征在于，所述基于所述第一语音识别模型的第一识别结果和所述第二语音识别模型的第二识别结果，确定目标输出的识别结果，包括：基于预设的概率计算模型，计算目标输出的识别结果为第一识别结果的概率，以及目标输出的识别结果为第二识别结果的概率，确定所述第一识别结果和所述第二识别结果中对应概率最大的为目标输出的识别结果。3.根据权利要求1所述的方法，其特征在于，所述基于所述第一语音识别模型的第一识别结果和所述第二语音识别模型的第二识别结果，确定目标输出的识别结果，包括：对所述第一语音识别模型得到的第一识别结果和所述第二语音识别模型得到的第二识别结果进行纠错处理得到第三识别结果；基于所述第一识别结果、第二识别结果和第三识别结果，形成第一集合；基于预设打分模型计算所述第一集合中每个识别结果的打分；基于每个识别结果的打分确定目标输出的识别结果。4.根据权利要求3所述的方法，其特征在于，所述基于所述第一识别结果、第二识别结果和第三识别结果，形成第一集合，包括：分别对所述第一识别结果、第二识别结果和第三识别结果进行特征提取，基于特征提取的结果形成第一集合。5.根据权利要求4所述的方法，其特征在于，所述基于每个识别结果的打分确定目标输出的识别结果，包括：确定打分最高的识别结果为目标输出的识别结果。6.根据权利要求4所述的方法，其特征在于，所述基于每个识别结果的打分确定目标输出的识别结果，包括：针对所述第一集合中的每个识别结果，将所述识别结果与其对应的打分组成一个元素；基于得到的所有元素形成第二集合；将所述第二集合输入预先训练获得的排序机中，将排序机输出的排序最高的识别结果作为目标输出的识别结果。7.根据权利要求1-6中任一项所述的方法，其特征在于，当所述第一语音识别模型和所述第二语音识别模型均得到多个识别结果时，所述基于所述第一语音识别模型的第一识别结果和所述第二语音识别模型的第二识别结果，确定目标输出的识别结果之前，所述方法还包括：确定所述第一语音识别模型得到的多个识别结果中输出频率最高的为第一识别结果；确定所述第二语音识别模型得到的多个识别结果中输出频率最高的为第二识别结果。8.根据权利要求1-6中任一项所述的方法，其特征在于，其特征在于，所述获取在采集获得所述语音信号时所述终端设备所在的第一区域之后，所述方法还包括：显示语音识别的区域条件为第一区域。9.一种语音识别装置，其特征在于，包括：获取模块，用于获取终端设备上搭载的音频...

【专利技术属性】
技术研发人员：韩文辉，蒋正翔，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人