语音识别纠错方法、系统、装置及存储介质制造方法及图纸

技术编号：31315611 阅读：18 留言：0更新日期：2021-12-12 23:52

本发明专利技术公开了一种语音识别纠错方法、系统、装置及存储介质，涉及人工智能技术，该方法包括：对待检测语音进行语音识别，获取到待检测文本和对应的待检测发音序列；根据待检测发音序列构建待检测FST；根据待检测FST和关键词FST，确定待检测文本中的若干待纠错字词，并确定包含待纠错字词的待纠错语句；若汉字混淆集中存在待纠错字词，确定每个待纠错字词对应的替换字词，并将待纠错语句中的待纠错字词替换为替换字词，生成替换语句；当待纠错语句的第一逻辑得分小于替换语句的第二逻辑得分，将待检测文本中的待纠错语句替换为替换语句，完成纠错。本发明专利技术的技术方案可实现根据发音确定可能存在错误的字词，实现对语音识别文本的有效纠错。纠错。纠错。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别纠错方法、系统、装置及存储介质

[0001]本专利技术涉及人工智能技术，尤其涉及一种语音识别纠错方法、系统、装置及存储介质。

技术介绍

[0002]随着深度学习技术的不断发展，应用深度学习技术的语音识别领域取得重大的突破，语音识别(Automatic Speech Recognition，ASR)的准确率也越来越高。相对于其他人机交互的方式，以语音识别为主的交互更简单，而且符合人们的日常习惯，因此语音识别技术正在逐渐渗透到智能家居、数字医疗、自动驾驶等领域。
[0003]但是，在实际的应用中，语音识别技术还是受到很大的限制，例如用户的发音不够标准，环境噪音较大等等因素都会影响语音识别的准确性，为了提高语音识别的准确性，相关技术中提出基于文本对语音识别文本进行语法或句法纠错的方案，但这种方案准确率较低，而且，对于不同垂直领域有不同的错误模式，相关技术中的方案难以有效地发现语音识别文本中的错误，从而导致语音识别技术的准确度下降。

技术实现思路

[0004]本申请旨在至少在一定程度上解决相关技术中的...

【技术保护点】

【技术特征摘要】
1.一种语音识别纠错方法，其特征在于，所述方法包括：对待检测语音进行语音识别，得到待检测文本和对应的待检测发音序列；根据所述待检测发音序列，构建待检测FST；获取关键词FST和汉字混淆集；其中，所述关键词FST、所述汉字混淆集及所述待检测FST属于同一垂直领域；根据所述待检测FST和所述关键词FST，确定所述待检测文本中的若干待纠错字词以及若干待纠错语句；其中，所述待纠错语句包含所述待纠错字词；若所述待纠错字词存在于所述汉字混淆集中，根据所述汉字混淆集确定每个所述待纠错字词对应的替换字词；将所述待纠错语句中的所述待纠错字词替换为所述替换字词，得到替换语句；计算所述待纠错语句的第一逻辑得分和所述替换语句的第二逻辑得分；当所述第一逻辑得分小于所述第二逻辑得分，将所述待检测文本中的待纠错语句替换为所述替换语句。2.根据权利要求1所述的纠错方法，其特征在于，所述根据所述待检测FST和所述关键词FST，确定所述待检测文本中的若干待纠错字词，包括：将所述待检测FST与所述关键词FST进行重组；若所述待检测FST与所述关键词FST中存在若干相同节点，将所述待检测文本中对应所述相同节点的字词确定为待纠错字词；其中，所述相同节点的数量与所述待纠错字词的字数相同。3.根据权利要求1所述的纠错方法，其特征在于，所述获取关键词FST和汉字混淆集，包括：获取训练语音，所述训练语音与所述待检测语音属于同一垂直领域；对所述训练语音进行语音识别，得到语音识别文本；根据所述语音识别文本，确定对应的第一发音序列；对所述训练语音进行人工识别，得到人工识别文本；根据所述人工识别文本，确定对应的第二发音序列；根据所述语音识别文本和所述人工识别文本，构建所述汉字混淆集；根据所述第一发音序列和所述第二发音序列，构建发音混淆集；根据所述发音混淆集、所述语音识别文本、所述人工识别文本、所述第一发音序列和所述第二发音序列，构建关键词表；根据所述关键词表，构建所述关键词FST。4.根据权利要求3所述的纠错方法，其特征在于，所述根据所述语音识别文本和所述人工识别文本，构建所述汉字混淆集，包括：将所述语音识别文本中的第一字词与所述人工识别文本中对应位置的第二字词进行比较；若当前所述第一字词与当前所述第二字词存在差异，将当前所述第一字词和当前所述第二字词作为所述替换字词，并将所述替换字词存入第一候选区；当所述第一字词和所述第二字词比较完毕，将存在相同字词的若干所述第一候选区合并为同一个第二候选区；
构建包括若干所述第二候选区的所述汉字混淆集。5.根据权利要求3所述的纠错方法，其特征在于，所述根据所述第一发音序列和所述第二发音序列，构建所述发音混淆集，包括：将所述第一发音序列中的第一拼音单元和所述第二发音序列中对应位置的第二拼音单元进行比较；若当前的所述第一拼音单元与当前的所述第二拼音单元存在差异，将当前的所述第一拼音单元和当前的所述第二拼音单元存入第一混淆区；...

【专利技术属性】
技术研发人员：庄子扬，魏韬，马骏，王少军，肖京，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人