音频数据的处理方法、音频处理模型的训练方法技术

技术编号：42373733 阅读：24 留言：0更新日期：2024-08-16 14:57

本申请公开了一种音频数据的处理方法、音频处理模型的训练方法，涉及大模型技术中的音频数据处理领域。其中，该方法包括：获取多个原始音频数据；利用适配器模型分别对多个原始音频数据进行处理，得到多个原始音频数据的梯度特征；基于多个原始音频数据的梯度特征，将多个原始音频数据与数据库中的预设音频数据进行匹配；确定多个原始音频数据中与预设音频数据匹配成功的原始音频数据，为至少一个目标音频数据，其中，数据库用于存储对预训练模型的性能影响程度大于预设程度的音频数据。本申请解决了相关技术中通过海量数据对大语音模型进行训练的训练准确度和训练效率低的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及大模型技术中的音频数据领域，具体而言，涉及一种音频数据的处理方法、音频处理模型的训练方法。

技术介绍

1、随着人工智能的飞速发展，对于语音识别大模型的要求也越来越高。目前，对语音识别大模型进行训练的技术方案，主要是通过海量的音频数据对语音识别大模型进行训练。但是海量的音频数据中很大可能包含了无效的音频数据，这就会导致对语音识别大模型的训练准确度低，且海量的音频数据会导致对语音识别大模型的训练效率低。

2、针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

1、本申请实施例提供了一种音频数据的处理方法、音频处理模型的训练方法，以至少解决相关技术中通过海量数据对大语音模型进行训练的训练准确度和训练效率低的技术问题。

2、根据本申请实施例的一个方面，提供了一种音频数据的处理方法，包括：获取多个原始音频数据；利用适配器模型分别对多个原始音频数据进行处理，得到多个原始音频数据的梯度特征，其中，梯度特征用于表征利用适配器模型对多个原始音频数据进行处理所得到的梯...

【技术保护点】

1.一种音频数据的处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述利用适配器模型分别对所述多个原始音频数据进行处理，得到所述多个原始音频数据的梯度特征，包括：

3.根据权利要求1所述的方法，其特征在于，所述基于所述多个原始音频数据的梯度特征，将所述多个原始音频数据与数据库中的预设音频数据进行匹配，包括：

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

5.根据权利要求4所述的方法，其特征在于，所述基于至少一个影响因素对所述多个训练音频数据进行数据增强，得到所述预设音频数据，包括如下至少之一：

<...

【技术特征摘要】

1.一种音频数据的处理方法，其特征在于，包括：

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

6.根据权利要求4所述的方法，其特征在于，所述利用所述适配器模型对所述预设音频数据进行处理，得到所述预设音频数据的梯度特征，包括：

7.根据权利要求1至6中任意一项所述的方法，其特征在于，所述方法还包括：

8.根据权利要求1至6中任意一项所述的方法，其特征在于，所述利用适配器模型分别对所述多个原始音频数据进行处理，得到所述多个原始音频数据的梯度特征，包括：

9.一种音频处理模型的训练方法，其...

【专利技术属性】
技术研发人员：张冲，马煜坤，马斌，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人