一种语音识别的方法和装置制造方法及图纸

技术编号:10389616 阅读:65 留言:0更新日期:2014-09-05 14:33
本申请提供了一种语音识别的方法和装置,包括:接收语音识别系统输出的多个候选识别结果,将所述多个候选识别结果分别与知识库中的模板进行匹配,其中,所述知识库包括实体词表和模板,所述模板存储符合正则表达式的书写规则语句;若所述多个候选识别结果与知识库中的模板匹配均不成功,则计算多个候选识别结果与知识库中存储的模板的距离;根据所述距离和多个候选识别结果的信任度得到多个候选识别结果的匹配分值,根据所述匹配分值将所述多个候选识别结果分别与知识库中的模板进行匹配,得到所述多个候选识别结果与知识库中的模板的匹配度;根据所述匹配度,输出匹配后的识别结果。因此,本申请解决了现有语音识别错误对问答系统影响的问题。

【技术实现步骤摘要】
一种语音识别的方法和装置
本申请涉及语音识别领域,特别是涉及一种语音识别的方法和装置。
技术介绍
近年来,随着语言处理技术的发展,智能问答系统受到了极大的关注,从聊天软件‘小黄鸡’的风靡,到流行于各大网络平台的应答机器人,智能问答系统在众多领域得到广泛应用。大多数问答系统都是以文本键入的形式作为问答系统的输入,繁琐费时,特别是在移动终端(如手机)等无键盘设备上或对于老年人、残疾人等操作困难人群,文本输入变得异常困难。因此,基于语音输入的问答系统应运而生,用户以口述的形式输入问题,经过语音识别,把识别结果传给问答系统进行处理,这样减少了用户的操作,提高了用户体验。语音智能问答系统具有方便、快捷、适用人群广泛的优点,然而,将语音作为用户输入带来了新的问题。由于用户的声音质量的不确定性、环境噪声的多样性、用户口音变异、未登录词等各种复杂因素的影响,语音识别的精度很难保证。现有技术中语音识别技术对标准普通话的识别正确率大约在90%左右,如果存在较高的噪音和口音,识别率的正确率就大大降低了。错误的识别结果会影响问答系统对用户输入的理解,进而影响问答系统的正确率。目前,解决上述问题的方法是通过增加问答系统的知识领域来提高语音识别系统的准确率。然而上述方法,一方面存在着某些语音识别错误在后续问答系统中扩大,导致问答系统正确率急剧下降。另一方面,问答系统本身在容错时容易忽略非关键字,在此情形下对输入问题进行模糊匹配时,将导致问答系统输出错误结果的可能性大大增加。
技术实现思路
本申请提供一种语音识别的方法和装置,以解决上述现有语音识别错误对问答系统影响的问题。为了解决上述问题,本申请公开了一种语音识别的方法,包括:接收语音识别系统输出的多个候选识别结果,将所述多个候选识别结果分别与知识库中的模板进行匹配,其中,所述知识库包括实体词表和模板,所述实体词表存储实体词,所述模板存储符合正则表达式的书写规则语句;若所述多个候选识别结果与知识库中的模板匹配均不成功,则计算多个候选识别结果与知识库中存储的模板的距离;根据所述距离和多个候选识别结果的信任度得到多个候选识别结果的匹配分值,根据所述匹配分值将所述多个候选识别结果分别与知识库中的模板进行匹配,得到所述多个候选识别结果与知识库中的模板的匹配度;根据所述匹配度,输出匹配后的识别结果。优选地,所述计算多个候选识别结果与知识库中存储的模板的距离的步骤包括:通过编辑距离修正公式计算多个候选识别结果与知识库中存储的模板的距离,包括:通过第一编辑距离修正公式,计算多个候选识别结果与知识库中存储的模板的第一距离,其中,所述第一编辑距离修正公式用于根据多个候选识别结果的字符串转换为知识库中存储的模板的字符串的距离和插入错误的算法参数得到多个候选识别结果与知识库中存储模板之间的距离;通过第二编辑距离修正公式,计算多个候选识别结果与知识库中存储的模板的第二距离,其中,所述第二编辑距离修正公式用于根据多个候选识别结果的字符串转换为知识库中存储的模板的字符串的距离和删除错误的算法参数得到多个候选识别结果与知识库中存储模板之间的距离;通过第三编辑距离修正公式,计算多个候选识别结果与知识库中存储的模板的第三距离,其中,所述第三编辑距离修正公式用于根据多个候选识别结果的字符串转换为知识库中存储的模板的字符串的距离和多个候选识别结果字符串的音素与知识库中存储的模板的字符串的标准音素的失配分值得到多个候选识别结果与知识库中存储模板之间的距离;将所述第一距离、第二距离和第三距离中的最小值确定为所述多个候选识别结果与知识库中存储的模板的距离。优选地,所述第一编辑距离修正公式为:D(N,M)=D(i-1,j)+c;所述第二编辑距离修正公式为:D(N,M)=D(i,j-1)+v;所述第三编辑距离修正公式为:D(N,M)=D(i-1,j-1)+d(w,v);其中,i为多个候选识别结果的字符串,j为知识库中存储的模板的字符串,c和v为算法参数,c为插入错误失配权重,v为删除错误失配权重,d(w,v)为多个候选识别结果第i-1个字符串的音素与知识库中存储的模板的第j-1个字符串的标准音素的失配分值,D(N,M)为多个候选识别结果与知识库中存储的模板的距离。优选地,所述d(w,v)通过以下方式获得:根据混淆矩阵计算多个候选识别结果第i-1个字符串的音素与知识库中存储的模板的第j-1个字符串的标准音素的失配分值。优选地,所述根据所述距离和多个候选识别结果的信任度得到多个候选识别结果的匹配分值的步骤包括:根据所述距离和多个候选识别结果的信任度,使用贝叶斯公式计算多个候选识别结果的匹配分值。优选地,其中,所述贝叶斯公式为:D(O,L)=D(N,M)P(X|O);其中,O为输入语音,X为多个候选识别结果,P(X|O)为语音识别系统对多个候选识别结果X的信任度,D(N,M)为多个候选识别结果与知识库中存储的模板的距离,D(O,L)为多个候选识别结果的匹配分值。为了解决上述问题,本申请还公开了一种语音识别的装置,包括:接收模块,用于接收语音识别系统输出的多个候选识别结果,将所述多个候选识别结果分别与知识库中的模板进行匹配,其中,所述知识库包括实体词表和模板,所述实体词表存储实体词,所述模板存储符合正则表达式的书写规则语句;计算模块,用于若所述多个候选识别结果与知识库中的模板匹配均不成功,则计算多个候选识别结果与知识库中存储的模板的距离;匹配模块,用于根据所述距离和多个候选识别结果的信任度得到多个候选识别结果的匹配分值,根据所述匹配分值将多个候选识别结果分别与知识库中的模板进行匹配,得到所述多个候选识别结果与知识库中模板的匹配度;输出模块,用于根据所述匹配度,输出匹配后的识别结果。优选地,所述计算模块通过编辑距离修正公式计算多个候选识别结果与知识库中存储的模板的距离,包括:第一编辑距离修正公式,计算多个候选识别结果与知识库中存储的模板的第一距离,其中,所述第一编辑距离修正公式用于根据多个候选识别结果的字符串转换为知识库中存储的模板的字符串的距离和插入错误的算法参数得到多个候选识别结果与知识库中存储模板之间的距离;通过第二编辑距离修正公式,计算多个候选识别结果与知识库中存储的模板的第二距离,其中,所述第二编辑距离修正公式用于根据多个候选识别结果的字符串转换为知识库中存储的模板的字符串的距离和删除错误的算法参数得到多个候选识别结果与知识库中存储模板之间的距离;通过第三编辑距离修正公式,计算多个候选识别结果与知识库中存储的模板的第三距离,其中,所述第三编辑距离修正公式用于根据多个候选识别结果的字符串转换为知识库中存储的模板的字符串的距离和多个候选识别结果字符串的音素与知识库中存储的模板的字符串的标准音素的失配分值得到多个候选识别结果与知识库中存储模板之间的距离;将所述第一距离、第二距离和第三距离中的最小值确定为所述多个候选识别结果与知识库中存储的模板的距离。优选地,所述第一编辑距离修正公式为:D(N,M)=D(i-1,j)+c;所述第二编辑距离修正公式为:D(N,M)=D(i,j-1)+v;所述第三编辑距离修正公式为:D(N,M)=D(i-1,j-1)+d(w,v);其中,i为多个候选识别结果的字符串,j为知识库中存储的模板的字符本文档来自技高网...
一种语音识别的方法和装置

【技术保护点】
一种语音识别的方法,其特征在于,包括:接收语音识别系统输出的多个候选识别结果,将所述多个候选识别结果分别与知识库中的模板进行匹配,其中,所述知识库包括实体词表和模板,所述实体词表存储实体词,所述模板存储符合正则表达式的书写规则语句;若所述多个候选识别结果与知识库中的模板匹配均不成功,则计算多个候选识别结果与知识库中存储的模板的距离;根据所述距离和多个候选识别结果的信任度得到多个候选识别结果的匹配分值,根据所述匹配分值将所述多个候选识别结果分别与知识库中的模板进行匹配,得到所述多个候选识别结果与知识库中的模板的匹配度;根据所述匹配度,输出匹配后的识别结果。

【技术特征摘要】
1.一种语音识别的方法,其特征在于,包括:接收语音识别系统输出的多个候选识别结果,将所述多个候选识别结果分别与知识库中的模板进行匹配,其中,所述知识库包括实体词表和模板,所述实体词表存储实体词,所述模板存储符合正则表达式的书写规则语句;若所述多个候选识别结果与知识库中的模板匹配均不成功,则计算多个候选识别结果与知识库中存储的模板的距离;根据所述距离和多个候选识别结果的信任度得到多个候选识别结果的匹配分值,根据所述匹配分值将所述多个候选识别结果分别与知识库中的模板进行匹配,得到所述多个候选识别结果与知识库中的模板的匹配度;根据所述匹配度,输出匹配后的识别结果;所述根据所述距离和多个候选识别结果的信任度得到多个候选识别结果的匹配分值的步骤包括:根据所述距离和多个候选识别结果的信任度,使用贝叶斯公式计算多个候选识别结果的匹配分值。2.根据权利要求1所述的方法,其特征在于,所述计算多个候选识别结果与知识库中存储的模板的距离的步骤包括:通过编辑距离修正公式计算多个候选识别结果与知识库中存储的模板的距离,包括:通过第一编辑距离修正公式,计算多个候选识别结果与知识库中存储的模板的第一距离,其中,所述第一编辑距离修正公式用于根据多个候选识别结果的字符串转换为知识库中存储的模板的字符串的距离和插入错误的算法参数得到多个候选识别结果与知识库中存储模板之间的距离;通过第二编辑距离修正公式,计算多个候选识别结果与知识库中存储的模板的第二距离,其中,所述第二编辑距离修正公式用于根据多个候选识别结果的字符串转换为知识库中存储的模板的字符串的距离和删除错误的算法参数得到多个候选识别结果与知识库中存储模板之间的距离;通过第三编辑距离修正公式,计算多个候选识别结果与知识库中存储的模板的第三距离,其中,所述第三编辑距离修正公式用于根据多个候选识别结果的字符串转换为知识库中存储的模板的字符串的距离和多个候选识别结果字符串的音素与知识库中存储的模板的字符串的标准音素的失配分值得到多个候选识别结果与知识库中存储模板之间的距离;将所述第一距离、第二距离和第三距离中的最小值确定为所述多个候选识别结果与知识库中存储的模板的距离。3.根据权利要求2所述的方法,其特征在于,所述第一编辑距离修正公式为:D(N,M)=D(i-1,j)+c;所述第二编辑距离修正公式为:D(N,M)=D(i,j-1)+v;所述第三编辑距离修正公式为:D(N,M)=D(i-1,j-1)+d(w,v);其中,i为多个候选识别结果的字符串,j为知识库中存储的模板的字符串,c和v为算法参数,c为插入错误失配权重,v为删除错误失配权重,d(w,v)为多个候选识别结果第i-1个字符串的音素与知识库中存储的模板的第j-1个字符串的标准音素的失配分值,D(N,M)为多个候选识别结果与知识库中存储的模板的距离。4.根据权利要求3所述的方法,其特征在于,所述d(w,v)通过以下方式获得:根据混淆矩阵计算多个候选识别结果第i-1个字符串的音素与知识库中存储的模板的第j-1个字符串的标准音素的失配分值。5.根据权利要求1所述的方法,其特征在于,其中,所述贝叶斯公式为:D(O,L)=D(N,M)P(X|O);其中,O为输入语音,X为多个候选识别结果,P...

【专利技术属性】
技术研发人员:乔亚飞赵芳游世学孟凡兴郑永涛
申请(专利权)人:北京中科汇联信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1