ASR文本纠错方法、模型、装置、电子设备、存储介质制造方法及图纸

技术编号：36907052 阅读：21 留言：0更新日期：2023-03-18 09:25

本申请提供一种ASR文本纠错方法，包括获得语音识别文本；将所述语音识别文本输入至训练后的纠错模型中进行纠错预测，获得每个单元文本的纠错预测结果；获取得分Topk的单元文本集作为单元文本的纠错候选集；获得单元文本的纠错结果；将所有所述单元文本的纠错结果综合得到所述语音识别文本的纠错结果。本申请通过对语音识别文本进行纠错预测，获得每个单元文本的纠错预测结果，而后对每个单元文本进行单独纠错，单元文本的纠错结果综合得到语音识别文本的纠错结果，缓解了BERT模型容易过纠的问题。采用基于BERT模型端到端的ASR纠错方法，避免pipeline架构的导致其错误会逐级放大，影响纠错方法的最终效果的问题。纠错方法的最终效果的问题。纠错方法的最终效果的问题。

全部详细技术资料下载

【技术实现步骤摘要】
ASR文本纠错方法、模型、装置、电子设备、存储介质

[0001]本申请涉及文本纠错
，具体涉及一种ASR文本纠错方法、模型、装置、电子设备、存储介质。

技术介绍

[0002]文本纠错是自然语言处理的基本任务之一，其主要内容是针对文本中的拼写错误进行检测与纠正。其应用场景十分广泛，例如输入法纠错、文本校对、ASR(Automatic Speech Recognition，自动语音识别技术)文本纠错等。而且文本纠错一般作为上游任务，其性能好坏直接影响着下游任务的最终效果。文本纠错任务的常见类型包括谐音字词、混淆音字词、形似字错误和字词补全等，针对不同的应用场景，这些错误类型并不一定全部存在。文本纠错因其重要性，直到今天仍是人们研究的热点。在早期，人们主要基于错误检测、候选召回、候选排序的pipeline系统架构进行文本纠错，如中国专利CN201510767379.3、CN201610976879.2以及CN201710817047.0都是基于这个系统架构的文本纠错方法。这类方法实现思路直观、可解释强并且模块化的结构易于模块升级和替换，但是其pipeline的系统结构导致其错误会逐级放大，影响纠错方法的最终效果，同时其串联链越长则耗时也越长。之后随着深度学习的崛起，人们开始重点研究端到端的文本纠错方法。纠错方法皆在一定程度上提升了文本纠错的效果，但是深度学习模型需要大量的训练数据进行模型参数学习，标注数据耗时耗力，人力成本极高，同时相比于传统的文本纠错方法，容易发生错纠的情况。
[0003]随着近年来语音类产...

【技术保护点】

【技术特征摘要】
1.一种ASR文本纠错方法，其特征在于，所述方法包括：获得语音识别文本；将所述语音识别文本输入至训练后的纠错模型中进行纠错预测，获得每个单元文本的纠错预测结果；获取得分Topk的单元文本集作为单元文本的纠错候选集；若所述单元文本的纠错预测结果存在于所述单元文本的纠错候选集中，则所述单元文本的预测结果作为所述单元文本的纠错结果；若所述单元文本的纠错预测结果不存在于所述单元文本的候选纠错集中，则选取所述单元文本的候选纠错集中得分最高的单元文本作为所述单元文本的纠错结果；将所有所述单元文本的纠错结果综合得到所述语音识别文本的纠错结果。2.根据权利要求1所述的ASR文本纠错方法，其特征在于，将所述语音识别文本输入至训练后的纠错模型中进行纠错预测，获得每个单元文本的纠错预测结果，包括：对语音识别文本进行编码，获得语音识别文本特征，所述语音识别文本特征包括有汉字信息、拼音信息；检测单元文本错误，输出单元文本错误概率，以指导对单元文本进行纠错；将所述语音识别文本特征、所述单元本文错误概率进行整合掩码，并发送至预测器；根据所述整合信息获得所述单元文本的纠错预测结果。3.根据权利要求2所述的ASR文本纠错方法，其特征在于，所述纠错模型的训练包括：获得训练数据，所述训练数据包括文字、文字所对应的拼音，所述拼音包括声母、韵母、声调；将所述训练数据输入至拼音BERT，以对所述拼音BERT进行训练；将文字BERT及训练后的拼音BERT结合对检测器进行训练，以提高检测器检测单元文本错误的准确度。4.根据权利要求3所述的ASR文本纠错方法，其特征在于，将所述训练数据输入至拼音BERT，以对所述拼音BERT进行训练，包括：输入文本的拼音预测文本的汉字；输入文本正确的拼音，比对文本正确的拼音与文本预测拼音的相似度。5.根据权利要求4所述的ASR文本纠错方法，其特征在于，拼音BERT的loss函数公式为：L
total
＝L
a
+L
b
+L
similarity
；其中L
a
表示句子a由拼音预测汉字的交叉熵损失；L
b
表示句子b由拼音预测汉字的交叉熵损失；L
similarity
表示句子a和句子b拼音表示的相似度交叉熵损失。交叉熵的计算方式如下所示：式中：y表示真实标注，表示预测结果。6.根据权利要求3所述的ASR文本纠错方法，其特征在于，所述纠错模型的训练包括：L
all
＝αL
correct
+(1
‑
α)L
contrast
式中：L
correct
表示纠错损失，本文使用交叉熵损失；L
contrast
表示对比损失；α表示纠错损失的权重，1
‑
α为对比损失的权重，是一个超参数，取值范围为(0，1)。其中L
contrast
...

【专利技术属性】
技术研发人员：杨稷，
申请(专利权)人：重庆长安汽车股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人