语音识别纠错数据集构建方法、电子设备、介质及产品技术

技术编号：43887487 阅读：37 留言：0更新日期：2025-01-03 13:03

本申请公开了一种语音识别纠错数据集构建方法、电子设备、介质及产品，涉及语音识别技术领域，语音识别纠错数据集构建方法包括：从预设的语音语料库获取语料数据；将语料数据分别输入到至少两个不同架构的语音识别模型中，得到各语音识别模型分别输出的语音识别文本；根据各语音识别模型分别输出的语音识别文本，构建语音识别纠错数据集。本申请的技术方案通过不同架构的语音识别模型增加错误特征的多样性，更贴合实际使用场景，能有效提高对语音识别纠错模型的训练效果。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及语音识别，尤其涉及一种语音识别纠错数据集构建方法、电子设备、计算机可读存储介质及计算机程序产品。

技术介绍

1、由于自动语音识别(automatic speech recognition,asr)技术在进行语音识别时，语音到文本的转换过程中会产生错误，语音识别纠错需求也随之产生。大语言模型由于其突出的语义理解能力常被用来对语音识别得到的文本进行纠错，而大语言模型在被用来开执行语音识别纠错的任务前，需要通过包括一定数量的错误语音识别文本的数据集进行训练。

2、目前有些语音识别纠错数据集的构建方案中，为了扩充语音识别纠错数据集的规模，会采用人为引入错误的方式，如替换参考文本中的一些文字为发音相近的字，来制造语音识别待纠错样本数据，但这种方式与实际的语音识别场景不符，可能会引入真实使用的语音识别模型中很少发生的语音识别错误，影响纠错模型的训练准确率。

3、上述内容仅用于辅助理解本申请的技术方案，并不代表承认上述内容是现有技术。

技术实现思路

1、本申请的主要目的...

【技术保护点】

1.一种语音识别纠错数据集构建方法，其特征在于，所述语音识别纠错数据集构建方法包括：

2.如权利要求1所述的语音识别纠错数据集构建方法，其特征在于，所述语音语料库至少包括第一语音语料库和第二语音语料库，所述第一语音语料库中的语料数据的平均语句长度小于所述第二语音语料库的平均语句长度；

3.如权利要求2所述的语音识别纠错数据集构建方法，其特征在于，在所述构建语音识别纠错数据集的步骤之后，所述方法还包括：

4.如权利要求1所述的语音识别纠错数据集构建方法，其特征在于，在所述构建语音识别纠错数据集的步骤之后，所述方法还包括：

5.如权利要求1所述...

【技术特征摘要】

1.一种语音识别纠错数据集构建方法，其特征在于，所述语音识别纠错数据集构建方法包括：

3.如权利要求2所述的语音识别纠错数据集构建方法，其特征在于，在所述构建语音识别纠错数据集的步骤之后，所述方法还包括：

4.如权利要求1所述的语音识别纠错数据集构建方法，其特征在于，在所述构建语音识别纠错数据集的步骤之后，所述方法还包括：

5.如权利要求1所述的语音识别纠错数据集构建方法，其特征在于，在所述构建语音识别纠错数据集的步骤之后，所述方法还包括：

6.如权利要求1所述的语音识别纠错数据集构建方法，其特征在于，在所述构建语音识别纠错数据集的步骤之后，...

【专利技术属性】
技术研发人员：葛娴，宋元峰，姜迪，
申请(专利权)人：深圳前海微众银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人