基于人工智能的语音识别纠错方法、装置及存储介质制造方法及图纸

技术编号:16327147 阅读:85 留言:0更新日期:2017-09-29 19:02
本发明专利技术公开了基于人工智能的语音识别纠错方法、装置及存储介质,其中方法包括:获取用户输入的第二语音query的第二语音识别结果;根据第二语音识别结果进行纠错意图识别;若确定用户具有纠错意图,则从第二语音识别结果中提取出纠错信息;根据纠错信息对各纠错资源进行筛选,利用选出的最为匹配的纠错资源对第一语音识别结果进行纠错,第一语音识别结果为在第二语音query之前输入的第一语音query的语音识别结果。应用本发明专利技术所述方案,能够提高纠错结果的准确性并降低纠错难度等。

【技术实现步骤摘要】
基于人工智能的语音识别纠错方法、装置及存储介质
本专利技术涉及计算机应用技术,特别涉及基于人工智能的语音识别纠错方法、装置及存储介质。
技术介绍
人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。随着语音及自然语言处理相关技术的发展,越来越多的应用场景提供语音方式同用户进行交互。但是,在用户输入语音query后,对用户的语音query进行识别时,得到的语音识别结果中很可能会出现错误。比如,对于长度较大的语音query,语音识别结果中很容易出现错误片段,当语音query中涉及实体名称时,对实体名称的识别会很容易出现错误,又或者,用户在输入时带有口音、口误或比较特殊的表述习惯等,均可能造成识别错误。现有技术中,针对用户输入的语音query的语音识别结果,可利用背景知识及统计方法等进行计算,本文档来自技高网...
基于人工智能的语音识别纠错方法、装置及存储介质

【技术保护点】
一种基于人工智能的语音识别纠错方法,其特征在于,包括:获取用户输入的第二语音query的第二语音识别结果;根据所述第二语音识别结果进行纠错意图识别;若确定用户具有纠错意图,则从所述第二语音识别结果中提取出纠错信息;根据所述纠错信息对各纠错资源进行筛选,利用选出的最为匹配的纠错资源对第一语音识别结果进行纠错,所述第一语音识别结果为在所述第二语音query之前输入的第一语音query的语音识别结果。

【技术特征摘要】
1.一种基于人工智能的语音识别纠错方法,其特征在于,包括:获取用户输入的第二语音query的第二语音识别结果;根据所述第二语音识别结果进行纠错意图识别;若确定用户具有纠错意图,则从所述第二语音识别结果中提取出纠错信息;根据所述纠错信息对各纠错资源进行筛选,利用选出的最为匹配的纠错资源对第一语音识别结果进行纠错,所述第一语音识别结果为在所述第二语音query之前输入的第一语音query的语音识别结果。2.根据权利要求1所述的方法,其特征在于,所述根据所述第二语音识别结果进行纠错意图识别包括:确定所述第二语音识别结果是否与预先设定的M个纠错意图模板中的至少一个相匹配,M为正整数;若是,则确定用户具有纠错意图;若否,则利用深度神经网络模型对所述第二语音识别结果进行意图分类,分类结果包括具有纠错意图以及不具有纠错意图。3.根据权利要求2所述的方法,其特征在于,所述从所述第二语音识别结果中提取出纠错信息包括:若利用所述纠错意图模板确定出用户具有纠错意图,则通过所述纠错意图模板的槽位信息确定出所述纠错信息;若利用所述深度神经网络模型确定出用户具有纠错意图,则通过序列标注模型,分别对所述第二语音识别结果中的每个字进行标注,利用标注为属于纠错信息的字组成所述纠错信息。4.根据权利要求1所述的方法,其特征在于,当纠错资源的种类为拆字资源时,该方法进一步包括:针对每个纠错资源,分别将所述纠错资源中的每个字转为对应的拼音,并根据所述纠错资源中的各个字及拼音,生成所述纠错资源的key;建立key与对应的纠错资源之间的倒排索引;所述根据所述纠错信息对各纠错资源进行筛选包括:将所述纠错信息中的每个字分别转为对应的拼音;确定所述纠错信息中的各个字是否组成一个key,如果是,则将所述key对应的纠错资源作为筛选出的纠错资源;确定所述纠错信息中的各个字对应的拼音是否组成一个key,如果是,则将所述key对应的纠错资源作为筛选出的纠错资源。5.根据权利要求4所述的方法,其特征在于,所述生成所述纠错资源的key包括:针对所述纠错资源中的各个字,分别以连续i个term为最小粒度得到连续kgram集合,并针对所述纠错资源中的各个字对应的拼音,分别以连续i个term为最小粒度得到连续kgram集合,i为正整数,且2≤i≤N,N为所述纠错资源中包括的字数;针对所述纠错资源中的各个字,分别以j个term为最小粒度得到不连续的跳跃kgram集合,并针对所述纠错资源中的各个字对应的拼音,分别以j个term为最小粒度得到不连续的跳跃kgram集合,j为正整数,且2≤j≤N-1。将所述连续kgram集合以及所述跳跃kgram集合中的元素分别作为所述纠错资源的key。6.根据权利要求4所述的方法,其特征在于,所述利用选出的最为匹配的纠错资源对第一语音识别结果进行纠错包括:针对筛选出的每个纠错资源,分别计算所述纠错资源中的各个字的拼音所组成的字符串与所述纠错信息中的各个字的拼音所组成的字符串之间的带权编辑距离;将计算出的带权编辑距离最小的纠错资源作为所述最为匹配的纠错资源,利用所述最为匹配的纠错资源对所述第一语音识别结果进行纠错。7.根据权利要求6所述的方法,其特征在于,所述计算带权编辑距离包括:在计算编辑距离时,对于增加和删除两种操作,编辑距离均为1,对于替换操作,计算两个音节之间的发音距离,发音距离越近,产生的编辑距离增加量越小。8.一种基于人工智能的语音识别纠错装置,其特征在于,包括:纠错意图识别单元、纠错信息提取单元以及纠错资源匹配单元;所述纠错意图识别单元,用于获取用户输入的第二语音query的第二语音识别结果,并根据所述第二...

【专利技术属性】
技术研发人员:李和瀚贺文嵩
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1