语音识别纠错模型训练方法、电子设备、介质及程序产品技术

技术编号：43925219 阅读：48 留言：0更新日期：2025-01-03 13:30

本申请公开了一种语音识别纠错模型训练方法、电子设备、介质及程序产品，涉及语音识别技术领域，语音识别纠错模型训练方法包括：获取第一训练文本，通过预设的大语言模型分别对第一训练文本和对应的第一真实文本中的预设类型文本的字符位置插入标记，得到第二训练文本和第二真实文本；将第二训练文本输入初始语音识别纠错模型，得到预测纠错文本；根据预测纠错文本和第二真实文本，计算损失函数值，损失函数值的计算过程中忽略标记过的文本；基于第二训练文本和损失函数值对初始语音识别纠错模型进行迭代训练，得到目标语音识别纠错模型。本申请的技术方案避免语音识别纠错模型在无法纠正的错误上浪费计算资源和时间，提高了训练效率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音识别，尤其涉及一种语音识别纠错模型训练方法、电子设备、计算机可读存储介质及计算机程序产品。

技术介绍

1、由于自动语音识别(automatic speech recognition,asr)技术在进行语音识别时，语音到文本的转换过程中会产生错误，语音识别纠错的需求也随之产生。语音识别的错误中有些是由于同音不同字的名称(如人名、地名、公司名等)或者代词(如她、它、他等)引起的，在没有上下文的情况下，这些错误通常难以被纠正。

2、目前，在训练用于进行语音纠错的大语言模型时，训练数据中通常也会包括这些无法纠正的错误，模型也无法有效学习，不能对这类错误进行有效纠正。但模型的训练过程中会将这些错误计入模型损失并进行迭代训练，浪费了不必要的计算资源和时间，影响模型训练效率。

3、上述内容仅用于辅助理解本申请的技术方案，并不代表承认上述内容是现有技术。

技术实现思路

1、本申请的主要目的在于提供一种语音识别纠错模型训练方法、电子设备、计算机可读存储介质及计算机程序产...

【技术保护点】

1.一种语音识别纠错模型训练方法，其特征在于，所述语音识别纠错模型训练方法包括：

2.如权利要求1所述的语音识别纠错模型训练方法，其特征在于，所述通过预设的大语言模型分别对所述第一训练文本和对应的第一真实文本中的预设类型文本的字符位置插入标记，得到第二训练文本和第二真实文本的步骤包括：

3.如权利要求2所述的语音识别纠错模型训练方法，其特征在于，所述通过所述大语言模型输出第二训练文本的步骤包括：

4.如权利要求1所述的语音识别纠错模型训练方法，其特征在于，所述根据所述预测纠错文本和所述第二真实文本，计算损失函数值的步骤包括：