当前位置: 首页 > 专利查询>南方电网数字电网集团有限公司广东分公司专利>正文

音频数据处理方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号：40904452 阅读：19 留言：0更新日期：2024-04-18 14:35

本申请公开了一种音频数据处理方法、装置、电子设备及可读存储介质，该方法通过获取目标训练数据集；将目标训练数据集输入初始识别模型，以确定目标训练数据集中每条语音数据对应的多个特征值和/或每两条语音数据之间的多个后验概率；根据多个特征值构造第一损失函数；和/或根据每两条语音数据之间的多个后验概率确定第二损失函数；根据第一损失函数和/或第二损失函数确定目标损失函数；根据目标损失函数确定目标识别模型；基于目标识别模型对不同语种的音频数据进行识别，以确定语音数据的目标语种。以此，提升了训练数据的数据质量以及基于优质训练数据训练得到的目标识别模型的质量，提升了后续目标识别模型进行识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，具体涉及一种音频数据处理方法、装置、电子设备及可读存储介质。

技术介绍

1、随着人工智能的不断发展，基于深度学习对不同的数据进行识别以达到智能识别效果成为一项技术热点。在对音频、图像等数据进行识别之前往往需要获取大量的包括待识别数据与识别结果的训练数据对识别模型进行训练，以得到能够准确识别数据的识别模型。然而，为了获得识别准确性高的识别模型，需要获取大量质量高的训练数据对识别模型进行训练。因此，如何对模型进行训练得到高质量的识别模型成为一项亟待解决的技术问题。

技术实现思路

1、本申请实施例提供一种音频数据处理方法、装置、电子设备及可读存储介质，可以获取高质量的训练数据，以提升识别模型的质量。

2、第一方面，本申请实施例公开了一种音频数据处理方法，包括：

3、获取目标训练数据集；其中，所述目标训练数据集包括第一训练数据集和第二训练数据集，所述第二训练数据集为对所述第一训练数据集进行掩码处理后的数据集；

4、将所述目标训练数据集输入初始...

【技术保护点】

1.一种音频数据处理方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述获取目标训练数据集包括：

3.如权利要求2所述的方法，其特征在于，所述对所述第一训练数据集中的每条语音数据进行掩码处理，得到第二训练数据集包括：

4.如权利要求1所述的方法，其特征在于，所述确定所述目标训练数据集中每条语音数据对应的多个特征值包括：

5.如权利要求4所述的方法，其特征在于，所述根据所述多个特征值构造第一损失函数，包括：

6.如权利要求1所述的方法，其特征在于，所述目标训练数据集包括进行掩码处理的多条语音数据和未进行掩...

【技术特征摘要】

1.一种音频数据处理方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述获取目标训练数据集包括：

3.如权利要求2所述的方法，其特征在于，所述对所述第一训练数据集中的每条语音数据进行掩码处理，得到第二训练数据集包括：

4.如权利要求1所述的方法，其特征在于，所述确定所述目标训练数据集中每条语音数据对应的多个特征值包括：

5.如权利要求4所述的方法，其特征在于，所述根据所述多个特征值构造第一损失函数，包括：

6.如权利要求1所述的方法，其特征在于，所述目标训练数据集包括进行掩码处理的多条语音数据和未进行掩码处理的多条语音数据，所述确定...

【专利技术属性】
技术研发人员：郑颖龙，吴广财，唐乐，陈非，马春，
申请(专利权)人：南方电网数字电网集团有限公司广东分公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人