语音识别错误的纠正方法及装置制造方法及图纸

技术编号:15398062 阅读:142 留言:0更新日期:2017-05-22 11:00
本发明专利技术提出了语音识别错误纠正方法及装置。语音识别错误纠正方法包括如下步骤:对语音识别结果的错误可能性进行判断;在错误可能性大于事先定义的基准的情况下,根据正确答案语料库以及语音识别结果是否匹配生成平行语料库;以平行语料库为基础,生成语音识别模型;以语音识别模型及语言模型为基础,对错误的语音识别结果进行纠正。根据本发明专利技术,可对通过语音识别所产生错误进行纠正。

Error correcting method and apparatus for speech recognition

The invention provides a method and a device for correcting speech recognition errors. Speech recognition error correction method comprises the following steps: judging the error probability of the speech recognition results; greater than the predefined reference in the error probability under the condition that the correct answer according to the corpus and the speech recognition results are matched to generate parallel corpora; parallel corpus based speech recognition model to generate; and language models for speech recognition based on the results of speech recognition errors are corrected. According to the invention, errors arising through speech recognition can be corrected.

【技术实现步骤摘要】
语音识别错误的纠正方法及装置本申请主张申请日为2012年12月7日的韩国专利申请No.10-2012-0141972的优先权,该在先申请的全文引入本说明书作为参考。
本专利技术涉及语音识别错误的纠正方法及装置,更详细地涉及一种用于纠正在语音识别装置中产生的错误的语音识别错误纠正方法及装置。
技术介绍
由于智能手机、平板电脑等移动设备的普及,提高了对语音识别应用软件(例如,如苹果公司的SIRI一样的对话系统)的关注。但是现在语音识别技术的准确度不高,由此频繁产生语音识别的错误,这导致了语音识别应用软件中出现故障。
技术实现思路
用于解决上述问题的本专利技术的目的在于,提供一种语音识别错误纠正方法,其用于以平行语料库为基础对语音识别的错误进行纠正。用于解决上述问题的本专利技术的另一个目的在于,提供一种语音识别错误纠正装置,其用于以平行语料库为基础对语音识别的错误进行纠正。在一些实施例中,语音识别错误纠正装置执行的语音识别错误纠正方法包括如下步骤:以通过正确答案语料库以及领域语料库学习的语言模型为基础,对语音识别结果的错误可能性进行判断;在上述错误可能性大于事先定义的基准的情况下,根据语音识别结果是否与正确答案语料库相匹配生成平行语料库;根据平行语料库生成语音识别模型;以及根据语音识别模型和语言模型,对错误的语音识别结果进行纠正。在此,在判断错误可能性的步骤中,可根据上述语音识别结果的生成概率对语音识别结果的错误可能性进行判断。在此,上述生成平行语料库的步骤可包括如下步骤:从上述正确答案语料库以及上述语音识别结果中对正确答案集进行检测;从上述正确答案语料库以及上述语音识别结果中对错误答案集进行检测;以及以上述正确答案语料库、上述语音识别结果、上述正确答案集及上述错误答案集为基础,生成上述平行语料库。在此,上述生成语音识别模型步骤可包括如下步骤:从上述平行语料库中对语音识别前的第一语法进行检测;从上述平行语料库中对语音识别后的第二语法进行检测;对上述第一语法和上述第二语法之间的语音识别概率进行计算;以及以上述第一语法、上述第二语法以及上述语音识别概率为基础,生成上述语音识别模型。在此,上述对语音识别结果的错误进行纠正的步骤可包括如下步骤:根据上述第一语法和上述第二语法之间的对应关系生成图表;从上述图表中对具有最小错误的路径进行检测;以及以检测的路径为基础,对上述错误的语音识别结果进行纠正。在此,上述生成图表的步骤中,在不存在对应于第二语法的第一语法的情况下,可将第二语法假设为第一语法。在此,在以上述检测的路径为基础对错误的语音识别结果进行纠正的步骤中,在无需根据语言模型进行重新排列的情况下,可对错误的语音识别结果进行纠正。根据用于实现上述目的的本专利技术的另一个实施例的语音识别错误纠正装置,其包括:处理部,其以通过正确答案语料库以及领域语料库学习的语言模型为基础,对语音识别结果的错误可能性进行判断,并且在错误可能性大于事先定义的基准的情况下,根据正确答案语料库以及语音识别结果是否相匹配生成平行语料库,并且以平行语料库为基础生成语音识别模型,并且以语音识别模型以及语言模型为基础对错误的语音识别结果进行纠正;存储部,其对上述处理部中所处理的信息以及已处理的信息进行存储。在此,所述处理部根据语音识别结果的生成概率对语音识别结果的错误可能性进行判断。在此,所述处理部从正确答案语料库以及语音识别结果中对正确答案集进行检测,并且从正确答案语料库以及语音识别结果中对错误答案集进行检测,并且以正确答案语料库、语音识别结果、正确答案集以及错误答案集为基础生成平行语料库。所述处理部从平行语料库中对语音识别前的第一语法进行检测,并且从平行语料库中对语音识别后的第二语法进行检测,并且对第一语法和第二语法之间的语音识别概率进行计算,并且以第一语法、第二语法以及语音识别概率为基础生成所述语音识别模型。在此,所述处理部对根据第一语法和第二语法之间的对应关系生成图表,并且从所述图表中对具有最小错误的路径进行检测,并且以检测到的路径为基础,对错误的语音识别结果进行纠正。在此,所述处理部在不存在对应于第二语法的第一语法的情况下,将第二语法假设为第一语法,从而生成所述图表。在此,所述处理部在无需根据语言模型进行重新排列的情况下,对错误的语音识别结果进行纠正。根据本专利技术,可对语音识别产生的错误进行纠正,从而提高语音识别的准确度。附图说明图1是表示语音识别装置的框图;图2是表示根据本专利技术的一个实施例的语音识别错误纠正方法的流程图;图3是表示根据本专利技术的一个实施例的语音识别错误纠正方法中生成平行语料库的步骤的流程图;图4是根据本专利技术的一个实施例的语音识别错误纠正方法中生成语音识别模型的步骤的流程图;图5是表示语音识别模型的示意图;图6是表示根据本专利技术的一个实施例的语音识别错误纠正方法中对语音识别结果的错误进行纠正的步骤的流程图;图7是表示根据语法对应关系的图表的示意图。图8是表示根据本专利技术的一个实施例的语音识别错误纠正装置的框图。图9是表示根据本专利技术的另一个实施例的语音识别错误纠正装置的框图。具体实施方式本专利技术可增加各种变更,并且可具有各种实施例,将特定实施例示出于附图中,并且将会进行详细说明。但是,上述不会将本专利技术限定在特定实施例形态,而是应理解为包括在本专利技术的思想以及技术范围内的所有变更、等同物或者替代物。第一、第二等术语可用于说明各种构成部件,但是不能使用上述术语对上述构成部件进行限定。使用上述术语的目的是将一个构成部件与其他构成部件进行区别。例如,在不脱离本专利技术的权利范围的情况下,第一构成部件可命名为第二构成部件,同样第二构成部件也可命名为第一构成部件。术语“以及/或者”包括多个相关的所记载的组件的组合或者多个相关的所记载的组件中的任何组件。当提到某构成部件“连接”或者“耦合”于其他构成部件时,可直接连接或者耦合于其他构成部件中,也可理解为在中间存在其他的构成部件。相反地,当提到某构成部件“直接连接”或者“直接耦合”于其他构成部件时,应理解为在中间不存在其他的构成部件。在本申请中所使用的术语只是为了说明特定的实施例而使用的,因此没有限定本专利技术的意图。单数的表达在上下文上只要没有明确地指出其他的意思,则包括复数的表达。在本申请中,“包括”或者“具有”等术语应理解为指定记载于说明书中的特征、数字、步骤、操作、构成部件、部件或者组合上述部分的存在,而不是排除一个或者一个以上的其他特征或者数字、步骤、操作、构成部件、部件或者组合上述部分的存在或者附加可能性。只要不做其他定义,包括技术性或者科学性的术语,在此使用的全部术语与本专利技术所属的
中具有一般知识的技术人员通常所理解的意思相同。通常所使用的事先定义的术语应理解为与相关技术的上下文上所具有的意思一致,只要在本申请中没有明确地定义,就不能理解为理想性或者过于形式性的意思。以下,参照附图,对本专利技术的优选实施例进行更详细说明。在说明本专利技术时,为了帮助整体上的理解,对附图上的相同构成部件使用相同的参照符号,并且对相同的构成部件省略重复说明。图1是表示语音识别装置的框图。参照图1,语音识别装置可包括语音识别部20、错误纠正部30以及语音识别应用部40。语音识别部20可接收语音信号10,并且对语音信号10进行识别本文档来自技高网
...
语音识别错误的纠正方法及装置

【技术保护点】
一种语音识别错误纠正方法,其在语音识别错误纠正装置中执行,其特征在于,包括如下步骤:以通过正确答案语料库以及领域语料库学习的语言模型为基础,对语音识别结果的错误可能性进行判断;从上述正确答案语料库以及上述语音识别结果中对正确答案集进行检测,从上述正确答案语料库以及上述语音识别结果中对错误答案集进行检测,以及以上述正确答案语料库、上述语音识别结果、上述正确答案集以及上述错误答案集为基础,生成平行语料库;以上述平行语料库为基础,生成语音识别模型;以及以语音识别模型以及语言模型为基础,对错误的语音识别结果进行纠正;其中,在判断错误可能性的步骤中,根据语音识别结果的生成概率对语音识别结果的错误可能性进行判断。

【技术特征摘要】
2012.12.07 KR 10-2012-01419721.一种语音识别错误纠正方法,其在语音识别错误纠正装置中执行,其特征在于,包括如下步骤:以通过正确答案语料库以及领域语料库学习的语言模型为基础,对语音识别结果的错误可能性进行判断;从上述正确答案语料库以及上述语音识别结果中对正确答案集进行检测,从上述正确答案语料库以及上述语音识别结果中对错误答案集进行检测,以及以上述正确答案语料库、上述语音识别结果、上述正确答案集以及上述错误答案集为基础,生成平行语料库;以上述平行语料库为基础,生成语音识别模型;以及以语音识别模型以及语言模型为基础,对错误的语音识别结果进行纠正;其中,在判断错误可能性的步骤中,根据语音识别结果的生成概率对语音识别结果的错误可能性进行判断。2.根据权利要求1所述的语音识别错误纠正方法,其特征在于,生成语音识别模型的步骤包括如下步骤:从上述平行语料库中对语音识别前的第一语法进行检测;从上述平行语料库中对语音识别后的第二语法进行检测;对第一语法和第二语法之间的语音识别概率进行计算;以及以第一语法、第二语法以及语音识别概率为基础,生成上述语音识别模型。3.根据权利要求2所述的语音识别错误纠正方法,其特征在于,对错误的语音识别结果进行纠正的步骤包括如下步骤:根据第一语法和第二语法之间的对应关系生成图表;从上述图表中对具有最小错误的路径进行检测;以及以检测的路径为基础,对错误的语音识别结果进行纠正。4.根据权利要求3所述的语音识别错误纠正方法,其特征在于:在生成图表的步骤中,在不存在对应于第二语法的第一语法的情况下,假设第二语法为第一语法。5.根据权利要求3所述的语音识别错误纠正方法,其特征在于:在以检测的路径为基础对错误的语...

【专利技术属性】
技术研发人员:李根培崔俊辉李仁载李东贤徐弘锡金龙熙柳成瀚具常俊
申请(专利权)人:浦项工科大学校产学协力团
类型:发明
国别省市:韩国,KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1