The invention provides a method and a device for correcting speech recognition errors. Speech recognition error correction method comprises the following steps: judging the error probability of the speech recognition results; greater than the predefined reference in the error probability under the condition that the correct answer according to the corpus and the speech recognition results are matched to generate parallel corpora; parallel corpus based speech recognition model to generate; and language models for speech recognition based on the results of speech recognition errors are corrected. According to the invention, errors arising through speech recognition can be corrected.
【技术实现步骤摘要】
语音识别错误的纠正方法及装置本申请主张申请日为2012年12月7日的韩国专利申请No.10-2012-0141972的优先权,该在先申请的全文引入本说明书作为参考。
本专利技术涉及语音识别错误的纠正方法及装置,更详细地涉及一种用于纠正在语音识别装置中产生的错误的语音识别错误纠正方法及装置。
技术介绍
由于智能手机、平板电脑等移动设备的普及,提高了对语音识别应用软件(例如,如苹果公司的SIRI一样的对话系统)的关注。但是现在语音识别技术的准确度不高,由此频繁产生语音识别的错误,这导致了语音识别应用软件中出现故障。
技术实现思路
用于解决上述问题的本专利技术的目的在于,提供一种语音识别错误纠正方法,其用于以平行语料库为基础对语音识别的错误进行纠正。用于解决上述问题的本专利技术的另一个目的在于,提供一种语音识别错误纠正装置,其用于以平行语料库为基础对语音识别的错误进行纠正。在一些实施例中,语音识别错误纠正装置执行的语音识别错误纠正方法包括如下步骤:以通过正确答案语料库以及领域语料库学习的语言模型为基础,对语音识别结果的错误可能性进行判断;在上述错误可能性大于事先定义的基准的情况下,根据语音识别结果是否与正确答案语料库相匹配生成平行语料库;根据平行语料库生成语音识别模型;以及根据语音识别模型和语言模型,对错误的语音识别结果进行纠正。在此,在判断错误可能性的步骤中,可根据上述语音识别结果的生成概率对语音识别结果的错误可能性进行判断。在此,上述生成平行语料库的步骤可包括如下步骤:从上述正确答案语料库以及上述语音识别结果中对正确答案集进行检测;从上述正确答案语料库以及上述语 ...
【技术保护点】
一种语音识别错误纠正方法,其在语音识别错误纠正装置中执行,其特征在于,包括如下步骤:以通过正确答案语料库以及领域语料库学习的语言模型为基础,对语音识别结果的错误可能性进行判断;从上述正确答案语料库以及上述语音识别结果中对正确答案集进行检测,从上述正确答案语料库以及上述语音识别结果中对错误答案集进行检测,以及以上述正确答案语料库、上述语音识别结果、上述正确答案集以及上述错误答案集为基础,生成平行语料库;以上述平行语料库为基础,生成语音识别模型;以及以语音识别模型以及语言模型为基础,对错误的语音识别结果进行纠正;其中,在判断错误可能性的步骤中,根据语音识别结果的生成概率对语音识别结果的错误可能性进行判断。
【技术特征摘要】
2012.12.07 KR 10-2012-01419721.一种语音识别错误纠正方法,其在语音识别错误纠正装置中执行,其特征在于,包括如下步骤:以通过正确答案语料库以及领域语料库学习的语言模型为基础,对语音识别结果的错误可能性进行判断;从上述正确答案语料库以及上述语音识别结果中对正确答案集进行检测,从上述正确答案语料库以及上述语音识别结果中对错误答案集进行检测,以及以上述正确答案语料库、上述语音识别结果、上述正确答案集以及上述错误答案集为基础,生成平行语料库;以上述平行语料库为基础,生成语音识别模型;以及以语音识别模型以及语言模型为基础,对错误的语音识别结果进行纠正;其中,在判断错误可能性的步骤中,根据语音识别结果的生成概率对语音识别结果的错误可能性进行判断。2.根据权利要求1所述的语音识别错误纠正方法,其特征在于,生成语音识别模型的步骤包括如下步骤:从上述平行语料库中对语音识别前的第一语法进行检测;从上述平行语料库中对语音识别后的第二语法进行检测;对第一语法和第二语法之间的语音识别概率进行计算;以及以第一语法、第二语法以及语音识别概率为基础,生成上述语音识别模型。3.根据权利要求2所述的语音识别错误纠正方法,其特征在于,对错误的语音识别结果进行纠正的步骤包括如下步骤:根据第一语法和第二语法之间的对应关系生成图表;从上述图表中对具有最小错误的路径进行检测;以及以检测的路径为基础,对错误的语音识别结果进行纠正。4.根据权利要求3所述的语音识别错误纠正方法,其特征在于:在生成图表的步骤中,在不存在对应于第二语法的第一语法的情况下,假设第二语法为第一语法。5.根据权利要求3所述的语音识别错误纠正方法,其特征在于:在以检测的路径为基础对错误的语...
【专利技术属性】
技术研发人员:李根培,崔俊辉,李仁载,李东贤,徐弘锡,金龙熙,柳成瀚,具常俊,
申请(专利权)人:浦项工科大学校产学协力团,
类型:发明
国别省市:韩国,KR
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。