一种文本纠错方法和电子设备技术

技术编号:33990728 阅读:47 留言:0更新日期:2022-07-02 09:37
本申请提供了一种文本纠错方法和电子设备,该方法及电子设备接收第一文本;利用意图识别模型识别所述第一文本的意图和槽位;根据所述意图选择对应的纠错模型进行纠错,所述纠错模型包括通用纠错模型和/或领域纠错模型;输出纠错后的目标文本。本申请提供的方案可以解决当识别后的文本中存在多字、漏字和错字问题导致无法纠错时或当识别到的属性信息范围不准确导致无法纠错时,仍然可以对识别后的信息进行高准确率的文本纠错,保证识别的意图和槽位的准确性。槽位的准确性。槽位的准确性。

【技术实现步骤摘要】
一种文本纠错方法和电子设备


[0001]本申请涉及纠错
,尤其涉及一种文本纠错方法和电子设备。

技术介绍

[0002]随着智能设备的普及和自然语言处理技术的发展,语音输入因其方便、快捷的特性而成为越来越重要的人机交互手段。但是由于语言的复杂多样和周围噪声影响,语音识别的结果往往与用户实际想输入的内容有较大的偏差,这就需要针对语音识别后的文本做进一步的纠错处理,才能应用到实际系统中。
[0003]针对语音识别后的文本进行进一步纠错处理,一种方案是针对语音识别后的文本执行搜索意图识别,确定对应的属性信息后,通过计算该属性信息与候选词库中词的相似度来进行纠错。候选词库维护格式为易错词到纠错词的映射词表,通过文本相似度函数依次针对词库中的易错词进行匹配,选择相似度最高的易错词所对应的纠错词作为纠错结果。但是,当文本错误导致意图识别发生错误时,该方案无法正确执行纠错逻辑。同时该方案通过易错词典的方式做错误词的定界,当意图识别方法提取到的属性信息范围不准确导致提取到的词未包含在易错词典中时,无法提供纠错能力。
[0004]另一种方案是本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本纠错方法,其特征在于,所述方法应用于电子设备,包括:接收第一文本;利用意图识别模型识别所述第一文本的意图和槽位;根据所述意图选择对应的纠错模型进行纠错,所述纠错模型包括通用纠错模型和/或领域纠错模型;输出纠错后的目标文本。2.根据权利要求1所述的方法,其特征在于,所述根据所述意图选择对应的纠错模型进行纠错,包括:若所述意图无对应的领域纠错模型,利用所述通用纠错模型进行纠错;若所述意图有对应的领域纠错模型,利用所述领域纠错模型进行纠错。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:输出所述目标文本的响应。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述输出纠错后的目标文本,包括:根据纠错结果和置信度值输出所述目标文本。5.根据权利要求4所述的方法,其特征在于,所述利用意图识别模型识别所述第一文本的意图和槽位,包括:利用所述意图识别模型识别所述第一文本的意图和槽位,并获得第一置信度值;所述根据所述意图选择对应的纠错模型进行纠错,包括:根据所述意图选择对应的纠错模型进行纠错,并获得第二置信度值;所述根据纠错结果和置信度值输出所述目标文本,包括:利用意图识别模型识别第二文本的意图和槽位,并获得第三置信度值,所述第二文本为对所述第一文本进行纠错后的文本或对纠错后的所述第一文本进行槽位替换后的文本;根据所述第一置信度值、所述第二置信度值和所述第三置信度值输出所述目标文本。6.根据权利要求5所述的方法,其特征在于,若选择利用所述领域纠错模型进行纠错,所述根据所述第一置信度值、所述第二置信度值和所述第三置信度值输出所述目标文本,包括:若所述第三置信度值大于或等于所述第一置信度值,根据所述第一置信度值和所述第二置信度值确定所述第二文本的第一联合纠错置信度值,所述第二文本为对纠错后的所述第一文本进行槽位替换后的文本,所述第一联合纠错置信度值包括多个置信度值;输出所述第一联合纠错置信度值中最大的置信度值所对应的目标文本。7.根据权利要求6所述的方法,其特征在于,所述第一联合纠错置信度值包括的多个置信度值由所述第一置信度值和所述第二置信度值中具有相同意图的置信度值相乘得到。8.根据权利要求6或7所述的方法,其特征在于,所述方法还包括:若所述第...

【专利技术属性】
技术研发人员:陈开济
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1