语音的离线识别方法、装置与存储介质制造方法及图纸

技术编号:20179320 阅读:20 留言:0更新日期:2019-01-23 01:11
本申请实施例公开了一种语音的离线识别方法、装置与存储介质,苏送方法包括:获取语音指令,并将所述语音指令转换成待识别文字;判断辞典中是否存在与所述待识别文字匹配的控制指令,所述辞典包括预设的N个控制指令;若所述辞典中不包括与所述待识别文字匹配的控制指令,则从多个预设的句式模板中查找与所述待识别文字匹配的目标句式模板;根据所述目标句式模板确定所述待识别文字的意图。即本实施例的方法,在辞典匹配失败之后,进行句式模板的匹配,进而提高了匹配的成功率,提高用户语音识别的体验。

Off-line Speech Recognition Method, Device and Storage Media

The embodiment of this application discloses an off-line speech recognition method, device and storage medium, which includes acquiring voice instructions and converting the voice instructions into text to be recognized; determining whether there are control instructions matching the text to be recognized in a dictionary, which includes preset N control instructions; and if the dictionary does not include the text to be recognized in the dictionary. The control instruction of word matching finds the target sentence pattern template matching the text to be recognized from a plurality of preset sentence pattern templates, and determines the intention of the text to be recognized according to the target sentence pattern template. That is, after the dictionary matching fails, the method of this example matches the sentence template, which improves the success rate of matching and the user's experience of speech recognition.

【技术实现步骤摘要】
语音的离线识别方法、装置与存储介质
本申请实施例涉及语音识别领域,尤其涉及一种语音的离线识别方法、装置与存储介质。
技术介绍
语音技术作为最令人期待的人机交互方式,必将逐步成为诸多交互方式中越来越关键的一种。例如,在汽车领域,可利用自然语言理解技术定制出高度实用的智能信息服务系统,用更人性化的人机交互方式提供更便捷、准确的信息语音命令和导航,对于驾驶的体验将是前景广阔的提升。对语音交互来说,离线识别是必不可少的功能,离线识别不仅要求产品具有本地将语音转化为文字的能力,同时也要求产品(例如车载装置)能够正确地理解到用户的意图,并做出相应的反馈。然而,现有的车载环境,语音识别通过对离线辞典中大量标记训练样本集进行匹配,若匹配不到,则识别失败。即现有技术,对离线辞典的依赖性比较高,语音识别的失败率高。
技术实现思路
本申请实施例提供一种语音的离线识别方法、装置与存储介质。第一方面,本申请实施例提供一种语音离线识别方法,包括:获取语音指令,并将所述语音指令转换成待识别文字;判断辞典中是否存在与所述待识别文字匹配的控制指令,所述辞典包括预设的N个控制指令;若所述辞典中不包括与所述待识别文字匹配的控制指令,则从多个预设的句式模板中查找与所述待识别文字匹配的目标句式模板;根据所述目标句式模板确定所述待识别文字的意图。在一方面的一种实现方式中,所述判断辞典中是否存在与所述待识别文字匹配的控制指令,包括:根据所述待识别文字,确定所述待识别文字与所述N个控制指令中每个控制指令的文字的第一相似度,获得N个第一相似度;根据所述N个第一相似度,判断所述辞典中是否存在与所述待识别文字匹配的控制指令。在一方面的另一种实现方式中,根据所述N个第一相似度,判断辞典中是否存在与所述待识别文字匹配的控制指令,包括:若所述N个第一相似度均小于第一预设值,则判断所述N个第一相似度中是否存在大于等于第二预设值的相似度;若存在,则确定辞典中存在与所述待识别文字匹配的控制指令;若不存在,则确定辞典中不存在与所述待识别文字匹配的控制指令;所述第一预设值大于所述第二预设值。在一方面的另一种实现方式中,根据所述N个第一相似度,判断辞典中是否存在与所述待识别文字匹配的控制指令,包括:若所述N个第一相似度均小于第一预设值,则根据所述待识别文字,确定所述待识别文字的拼音与所述N个控制指令中每个控制指令的拼音的第二相似度;判断所述N个第二相似度中是否存在大于等于第二预设值的相似度;若存在,则确定辞典中存在与所述待识别文字匹配的控制指令;若不存在,则确定辞典中不存在与所述待识别文字匹配的控制指令;所述第一预设值大于所述第二预设值。在一方面的另一种实现方式中,所述方法还包括:若所述N个第一相似度中存在大于或等于所述第一预设值的第一相似度,则根据该第一相似度对应的控制指令,确定所述待识别文字的意图。在一方面的另一种实现方式中,所述方法还包括:根据所述大于等于第二预设值的任一相似度所对应的控制指令,确定所述待识别文字的意图。在一方面的另一种实现方式中,所述方法还包括:根据所述大于等于第二预设值的相似度中最大相似度所对应的控制指令,确定所述待识别文字的意图。第二方面,本申请实施例提供一种语音离线识别装置,包括:获取模块,用于获取语音指令,并将所述语音指令转换成待识别文字;判断模块,用于判断辞典中是否存在与所述待识别文字匹配的控制指令,所述辞典包括预设的N个控制指令;查找模块,用于若所述辞典中不包括与所述待识别文字匹配的控制指令,则从多个预设的句式模板中查找与所述待识别文字匹配的目标句式模板;确定模块,用于根据所述目标句式模板确定所述待识别文字的意图。在二方面的一种实现方式中,所述判断模块,包括:确定单元,用于根据所述待识别文字,确定所述待识别文字与所述N个控制指令中每个控制指令的文字的第一相似度,获得N个第一相似度;判断单元,用于根据所述N个第一相似度,判断辞典中是否存在与所述待识别文字匹配的控制指令。在二方面的另一种实现方式中,所述判断单元,具体用于若所述N个第一相似度均小于第一预设值,则判断所述N个第一相似度中是否存在大于等于第二预设值的相似度;所述确定单元,用于若判断单元确定判断所述N个第一相似度中存在大于等于第二预设值的相似度,则确定辞典中存在与所述待识别文字匹配的控制指令;若判断单元确定判断所述N个第一相似度中不存在大于等于第二预设值的相似度,则确定辞典中不存在与所述待识别文字匹配的控制指令;所述第一预设值大于所述第二预设值。在二方面的另一种实现方式中,所述确定单元,具体用于若所述N个第一相似度均小于第一预设值,则根据所述待识别文字,确定所述待识别文字的拼音与所述N个控制指令中每个控制指令的拼音的第二相似度;所述判断单元,用于判断所述N个第二相似度中是否存在大于等于第二预设值的相似度;所述确定单元,还用于若所述判断单元判断所述N个第二相似度中存在大于等于第二预设值的相似度,则确定辞典中存在与所述待识别文字匹配的控制指令;若所述判断单元判断所述N个第二相似度中不存在大于等于第二预设值的相似度,则确定辞典中不存在与所述待识别文字匹配的控制指令;所述第一预设值大于所述第二预设值。在二方面的另一种实现方式中,所述确定模块,还用于若所述N个第一相似度中存在大于或等于所述第一预设值的第一相似度,则根据该第一相似度对应的控制指令,确定所述待识别文字的意图。在二方面的另一种实现方式中,所述确定模块,还用于根据所述大于等于第二预设值的任一相似度所对应的控制指令,确定所述待识别文字的意图。在二方面的另一种实现方式中,所述确定模块,还用于根据所述大于等于第二预设值的相似度中最大相似度所对应的控制指令,确定所述待识别文字的意图。第三方面,本申请实施例一种语音离线识别装置,包括:存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于获取语音指令,并将所述语音指令转换成待识别文字;判断辞典中是否存在与所述待识别文字匹配的控制指令;若所述辞典中不包括与所述待识别文字匹配的控制指令,则从多个预设的句式模板中查找与所述待识别文字匹配的目标句式模板;根据所述目标句式模板确定所述待识别文字的意图,其中所述辞典包括预设的N个控制指令。在第三方面的一种实现方式中,所述处理器具体用于:根据所述待识别文字,确定所述待识别文字与所述N个控制指令中每个控制指令的文字的第一相似度,获得N个第一相似度;根据所述N个第一相似度,判断辞典中是否存在与所述待识别文字匹配的控制指令。在第三方面的另一种实现方式中,所述处理器还具体用于:若所述N个第一相似度均小于第一预设值,则判断所述N个第一相似度中是否存在大于等于第二预设值的相似度;若存在,则确定辞典中存在与所述待识别文字匹配的控制指令;若不存在,则确定辞典中不存在与所述待识别文字匹配的控制指令;所述第一预设值大于所述第二预设值。在第三方面的另一种实现方式中,所述处理器还具体用于:若所述N个第一相似度均小于第一预设值,则根据所述待识别文字,确定所述待识别文字的拼音与所述N个控制指令中每个控制指令的拼音的第二相似度;判断所述N个第二相似度中是否存在大于等于第二预设值的相似度;若存在,则确定辞典中存在与所述待识别文字匹配的控制指令;若不存在,则确定辞典中不存本文档来自技高网...

【技术保护点】
1.一种语音离线识别方法,其特征在于,包括:获取语音指令,并将所述语音指令转换成待识别文字;判断辞典中是否存在与所述待识别文字匹配的控制指令,所述辞典包括预设的N个控制指令;若所述辞典中不包括与所述待识别文字匹配的控制指令,则从多个预设的句式模板中查找与所述待识别文字匹配的目标句式模板;根据所述目标句式模板确定所述待识别文字的意图。

【技术特征摘要】
1.一种语音离线识别方法,其特征在于,包括:获取语音指令,并将所述语音指令转换成待识别文字;判断辞典中是否存在与所述待识别文字匹配的控制指令,所述辞典包括预设的N个控制指令;若所述辞典中不包括与所述待识别文字匹配的控制指令,则从多个预设的句式模板中查找与所述待识别文字匹配的目标句式模板;根据所述目标句式模板确定所述待识别文字的意图。2.根据权利要求1所述的方法,其特征在于,所述判断辞典中是否存在与所述待识别文字匹配的控制指令,包括:根据所述待识别文字,确定所述待识别文字与所述N个控制指令中每个控制指令的文字的第一相似度,获得N个第一相似度;根据所述N个第一相似度,判断所述辞典中是否存在与所述待识别文字匹配的控制指令。3.根据权利要求2所述的方法,其特征在于,根据所述N个第一相似度,判断辞典中是否存在与所述待识别文字匹配的控制指令,包括:若所述N个第一相似度均小于第一预设值,则判断所述N个第一相似度中是否存在大于等于第二预设值的相似度;若存在,则确定辞典中存在与所述待识别文字匹配的控制指令;若不存在,则确定辞典中不存在与所述待识别文字匹配的控制指令;所述第一预设值大于所述第二预设值。4.根据权利要求2所述的方法,其特征在于,根据所述N个第一相似度,判断辞典中是否存在与所述待识别文字匹配的控制指令,包括:若所述N个第一相似度均小于第一预设值,则根据所述待识别文字,确定所述待识别文字的拼音与所述N个控制指令中每个控制指令的拼音的第二相似度;判断所述N个第二相似度中是否存在大于等于第二预设值的相似度;若存在,则确定辞典中存在与所述待识别文字匹配的控制指令;若不存在,则确定辞典中不存在与所述待识别文字匹配的控制指令;所述第一预设值大于所述第二预设值。5.根据权利要求3所述的方法,其特征在于,所述方法还包括:若所述N个第一相似度中存在大于或等于所述第一预设值的第一相似度,则根据该第一相似度对应的控制指令,确定所述待识别文字的意图。6.根据权利要求3或4所述的方法,其特征在于,所述方法还包括:根据所述大于等于第二预设值的任一相似度所对应的控制指令,确定所述待识别文字的意图。7.根据权利要求3或4所述的方法,其特征在于,所述方法还包括:根据所述大于等于第二预设值的相似度中最大相似度所对应的控制指令,确定所述待识别文字的意图。8.一种语音离线识别装置,其特征在于,包括:获取模块,用于获取语音指令,并将所述语音指令转换成待识别文字;判断模块,用于判断辞典中是否存在与所述待识别文字匹配的控制指令,所述辞典包括预设的N个控制指令;查找模块,用于若所述辞典中不包括与所述待识别文字匹配的控制指令,则从多个预设的句式模板中查找与所述待识别文字匹配的目标句式模板;确定模块,用于根据所述目标句式模板确定所述待识别文字的意图。9.根据权利要求8所述的装置,其特征在于,所述判断模块,包括:确定单元,用于根据所述待识别文字,确定所述待识别文字与所述N个控制指令中每个控制指令的文字的第一相似度,获得N个第一相似度;判断单元,用于根据所述N个第一相似度,判断辞典中是否存在与所述待识别文字匹配的控制指令。10.根据权利要求9所述的装置,其特征在于,所述判断单元,具体用于若所述N个第一相似度均小于第一预设值,则判断所述N个第一相似度中是否存在大于等于第二预设值的相似度;所述确定单元,用于若判断单元确定判断所述N个第一相似度中存在大于等于第二预设值的相似度,则确定辞典中存在与所述待识别文字匹配的控制指令;若判断单元确定判断所述N个第一相似度中不存在大于等于第二预设值的...

【专利技术属性】
技术研发人员:贺学焱宋晔欧阳能钧
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1