数据增强处理及模型训练方法、装置、电子设备制造方法及图纸

技术编号：38647319 阅读：26 留言：0更新日期：2023-09-02 22:38

本申请提供了一种数据增强处理及模型训练方法、装置、电子设备及存储介质，包括：根据原始数据的数据类型，确定原始数据的至少一个增强处理类别；根据至少一个增强处理类别的至少一个增强处理参数、随机生成的噪音参数，对原始数据执行数据增强处理，获得原始数据的增强数据。本申请通过引入随机的噪音参数，可确保数据增强处理结果的合理性和广泛性，并有助于提高模型训练效果。于提高模型训练效果。于提高模型训练效果。

全部详细技术资料下载

【技术实现步骤摘要】
数据增强处理及模型训练方法、装置、电子设备

[0001]本申请实施例涉及计算机
，尤其涉及一种数据增强处理及模型训练方法、装置、电子设备及存储介质。

技术介绍

[0002]数据增强处理是在深度学习领域中，通过生成原始数据的新数据(或称为增强数据)，以进行模型训练的技术手段，其通过在已有数据集的基础上合成新数据，使模型在训练中，能够充分挖掘少量已有数据包含的关键知识，从而提高模型的训练效果。
[0003]传统的数据增强方法，通过确定好的操作序列来执行原始数据的增强处理，以生成新数据，然而，由于操作序列的确定性，这种增强处理所得到的新数据，基本保持了与原有数据之间的相关性。使用这类新数据进行模型训练时，虽可使模型见多识广以充分学习，但并不能对模型缺陷进行有针对性的纠正。
[0004]为了解决传统数据增强结果，对于模型的缺陷问题存在针对性不足的问题，业界提出了对抗训练(Adversarial Training)的方法，其中，处理原始样本以生成对抗样本的过程可看成一种基于对抗的数据增强。对抗训练的目的是使模型的...

【技术保护点】

【技术特征摘要】
1.一种数据增强处理方法，包括：根据原始数据的数据类型，确定所述原始数据的至少一个增强处理类别；根据所述至少一个增强处理类别的至少一个增强处理参数、随机生成的噪音参数，对所述原始数据执行数据增强处理，获得所述原始数据的增强数据。2.根据权利要求1所述的方法，其中，所述方法借由数据增强处理模型执行，且其中，所述数据增强处理模型通过以下方式训练获得：利用待训练的数据增强处理模型对原始样本执行数据增强处理，获得所述原始样本的增强样本；对所述原始样本和所述增强样本执行相似度预测和差异度预测，获得模型损失值，基于所述模型损失值更新所述待训练的数据增强处理模型，并重复执行所述利用待训练的数据增强处理模型对原始样本执行数据增强处理的步骤，直至所述待训练的数据增强处理模型满足预设模型训练结束条件；获得所述数据增强处理模型。3.根据权利要求2所述的方法，其中，所述对所述原始样本和所述增强样本执行相似度预测和差异度预测，获得模型损失值，基于所述模型损失值更新所述待训练的数据增强处理模型，并重复执行所述利用待训练的数据增强处理模型对原始样本执行数据增强处理的步骤，直至所述待训练的数据增强处理模型满足预设模型训练结束条件，包括：对所述原始样本和所述增强样本执行相似度预测，获得所述原始样本和所述增强样本之间的相似度预测结果，并根据所述相似度预测结果，获得相似损失值；当所述相似度预测结果满足所述预设相似度条件时，对所述原始样本和所述增强样本执行差异度预测，获得所述原始样本和所述增强样本之间的差异度预测结果，当所述相似度预测结果不满足所述预设相似度条件时，根据所述相似损失值，更新所述待训练的数据增强处理模型的模型参数，并执行所述利用待训练的数据增强处理模型对原始样本执行数据增强处理的步骤；根据所述差异度预测结果，获得差异损失值，根据所述差异损失值和所述相似损失值，更新所述待训练的数据增强处理模型的模型参数，并执行所述利用待训练的数据增强处理模型对原始样本执行数据增强处理的步骤，直至所述待训练的数据增强处理模型满足所述预设模型训练结束条件。4.根据权利要求3所述的方法，其中，通过以下方式判断所述相似度预测结果满足或不满足所述预设相似度条件，包括：根据所述原始样本的原始标签、所述增强样本的增强标签，获得所述原始样本和所述增强样本之间的相似度参考结果；根据所述相似...

【专利技术属性】
技术研发人员：王汉超，张松，王彤，别晓芳，张睿，
申请(专利权)人：零束科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人