一种实时转译文本的纠错方法、系统、存储介质和装置制造方法及图纸

技术编号：31978834 阅读：20 留言：0更新日期：2022-01-20 01:32

本发明专利技术公开了一种实时转译文本的纠错方法、系统、存储介质和装置，涉及语音纠错领域。该方法包括：获取实时直播的ASR转译文本，通过训练后的BERT纠错模型对所述ASR转译文本进行解译，输出第一纠错文本；通过训练后的GPT纠错模型对所述ASR转译文本进行解译，输出第二纠错文本，结合所述第一纠错文本和所述第二纠错文本获得纠错目标文本，通过本方案实现对直播场景下的ASR转译文本内容进行端到端的纠错，可以有效的提升ASR对音频转译文本的字准确率，并可以快速应用到直播领域。并可以快速应用到直播领域。并可以快速应用到直播领域。

全部详细技术资料下载

【技术实现步骤摘要】
一种实时转译文本的纠错方法、系统、存储介质和装置

[0001]本专利技术涉及语音纠错领域，尤其涉及一种实时转译文本的纠错方法、系统、存储介质和装置。

技术介绍

[0002]由于语音信息存储容量大、内容复杂，不易于直接存储、监管和分析，因而使用自动语音识别技术(简称ASR)进行语音
‑
文本转译，对文本进一步存储、监管和分析。
[0003]近年来随着网络直播行业的兴起，以语音信号为载体的信息在互联网中大量传播，而当使用ASR进行语音
‑
文本转译时，由于直播环境的良莠不齐和ASR模型容量不足，导致足以改变语义的错误转译信息，如将“我想去大理”的音频信息转译为“我想去打理”的文本信息，因此对ASR转译文本进行纠错成为了ASR识别技术的重要技术瓶颈。
[0004]基于传统语言模型的纠错方法是通过探测器探测错误位置，再使用纠错器对错误位置进行纠错。此类算法的缺陷一方面是探测器标识纠错位置有误时，会额外增加错误。另一方面是两段式的纠错方式维护繁琐，尤其是纠错器的候选集构建，直播场景下口语交互复杂，语料众多，ASR转译错误也更难以显式的统计。目前在直播场景下，传统语言模型的ASR纠错方式难以达到使用级别。

技术实现思路

[0005]本专利技术所要解决的技术问题是针对现有技术的不足，提供一种实时转译文本的纠错方法、系统、存储介质和装置。
[0006]本专利技术解决上述技术问题的技术方案如下：
[0007]一种实时转译文本的纠错方法，包括：
[0...

【技术保护点】

【技术特征摘要】
1.一种实时转译文本的纠错方法，其特征在于，包括：S1，获取实时直播的ASR转译文本；S2，通过训练后的BERT纠错模型对所述ASR转译文本进行解译，输出第一纠错文本；通过训练后的GPT纠错模型对所述ASR转译文本进行解译，输出第二纠错文本；S3，结合所述第一纠错文本和所述第二纠错文本获得纠错目标文本。2.根据权利要求1所述的一种实时转译文本的纠错方法，其特征在于，所述S2之前还包括：收集历史直播场景下原始语音信息的ASR的转译文本和人工转译的标准文本；通过所述转译文本和所述标准文本构成原始语料库；通过所述原始语料库对所述BERT纠错模型和所述GPT纠错模型进行训练。3.根据权利要求2所述的一种实时转译文本的纠错方法，其特征在于，还包括：通过ASR采集所述原始语音信息的N
‑
best转译文本，结合所述N
‑
best转译文本对应的标准文本来扩充所述原始语料库。4.根据权利要求2或3任一项所述的一种实时转译文本的纠错方法，其特征在于，通过所述原始语料库对所述BERT纠错模型进行训练，具体包括：通过对齐算法对所述原始语料库中的所述转译文本和所述标准文本进行对齐处理；以所述标准文本为模板，通过纠错标识对对齐处理后的所述转译文本进行标记，获得带标记的转译文本序列，将所述带标记的转译文本序列作为所述BERT纠错模型的训练语料；设置所述BERT纠错模型的训练参数，将所述训练语料作为所述BERT纠错模型的输入，将所述标准文本作为训练目标，对所述BERT纠错模型进行训练，获得训练后的所述BERT纠错模型。5.根据权利要求4所述的一种实时转译文本的纠错方法，其特征在于，通过所述原始语料库对所述BERT纠错模型进行训练之前，还包括：在BERT纠错模型的输出层新增一层全连接网络层；将所述BERT纠错模型每个token神经元的输出映射为所述BERT预训练模型的词向量维度值；通过layer normalization对所述BERT纠错模型进行归一化约束处理，获取归一化处理后的所述BERT纠错模型的...

【专利技术属性】
技术研发人员：孙晓兵，齐路，唐会军，刘栓林，
申请(专利权)人：北京数美时代科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人