【技术实现步骤摘要】
本申请涉及人工智能,具体涉及一种音频数据处理方法、装置、电子设备及可读存储介质。
技术介绍
1、随着人工智能的不断发展,基于深度学习对不同的数据进行识别以达到智能识别效果成为一项技术热点。在对音频、图像等数据进行识别之前往往需要获取大量的包括待识别数据与识别结果的训练数据对识别模型进行训练,以得到能够准确识别数据的识别模型。然而,为了获得识别准确性高的识别模型,需要获取大量质量高的训练数据对识别模型进行训练。因此,如何对模型进行训练得到高质量的识别模型成为一项亟待解决的技术问题。
技术实现思路
1、本申请实施例提供一种音频数据处理方法、装置、电子设备及可读存储介质,可以获取高质量的训练数据,以提升识别模型的质量。
2、第一方面,本申请实施例公开了一种音频数据处理方法,包括:
3、获取目标训练数据集;其中,所述目标训练数据集包括第一训练数据集和第二训练数据集,所述第二训练数据集为对所述第一训练数据集进行掩码处理后的数据集;
4、将所述目标训练数据集输入初始
...【技术保护点】
1.一种音频数据处理方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述获取目标训练数据集包括:
3.如权利要求2所述的方法,其特征在于,所述对所述第一训练数据集中的每条语音数据进行掩码处理,得到第二训练数据集包括:
4.如权利要求1所述的方法,其特征在于,所述确定所述目标训练数据集中每条语音数据对应的多个特征值包括:
5.如权利要求4所述的方法,其特征在于,所述根据所述多个特征值构造第一损失函数,包括:
6.如权利要求1所述的方法,其特征在于,所述目标训练数据集包括进行掩码处理的多
...【技术特征摘要】
1.一种音频数据处理方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述获取目标训练数据集包括:
3.如权利要求2所述的方法,其特征在于,所述对所述第一训练数据集中的每条语音数据进行掩码处理,得到第二训练数据集包括:
4.如权利要求1所述的方法,其特征在于,所述确定所述目标训练数据集中每条语音数据对应的多个特征值包括:
5.如权利要求4所述的方法,其特征在于,所述根据所述多个特征值构造第一损失函数,包括:
6.如权利要求1所述的方法,其特征在于,所述目标训练数据集包括进行掩码处理的多条语音数据和未进行掩码处理的多条语音数据,所述确定...
【专利技术属性】
技术研发人员:郑颖龙,吴广财,唐乐,陈非,马春,
申请(专利权)人:南方电网数字电网集团有限公司广东分公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。