训练数据的增强方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：34133945 阅读：77 留言：0更新日期：2022-07-14 16:08

本申请涉及模型训练领域，特别是涉及到一种训练数据的增强方法、装置、计算机设备及存储介质，所述方法包括：获取训练数据集；将所述训练数据集输入至分类模型进行预训练，获取分类错误的原始图像及分类数据；将所述原始图像输入预设的残差网络，获取所述原始图像的特征；根据所述分类数据计算所述特征的互信息，并根据所述互信息筛选所述特征中影响度大于预设值的虚假特征；根据所述虚假特征对所述原始图像进行数据增强，得到目标图像；根据所述目标图像生成增强训练数据集，以基于所述增强训练数据集对所述分类模型进行重新训练。本申请可以对模型的错误进行溯源，寻找与预测结果具有相关性的特征，并对原始数据集进行增强，提高模型的鲁棒性。提高模型的鲁棒性。提高模型的鲁棒性。

Training data enhancement method, device, computer equipment and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
训练数据的增强方法、装置、计算机设备及存储介质

[0001]本申请涉及模型训练领域，特别是涉及到一种训练数据的增强方法、装置、计算机设备及存储介质。

技术介绍

[0002]基于卷积神经网络的分类方法目前在多个任务上都表现出了良好的性能，但其泛化能力依然受限。在不同的工作中，模型的表现可能会有很大的差异，这影响了使用者对模型的信任度，而目前，对于解决模型识别结果出现错误的情况，大多采用增加训练数据量进行解决，无法从根本上对模型进行改进，导致模型的鲁棒性较低。

技术实现思路

[0003]本申请的主要目的为提供一种训练数据的增强方法、装置、计算机设备及存储介质，旨在解决训练数据中存在明显影响模型结果错误数据导致模型的鲁棒性较低的问题。
[0004]为了实现上述专利技术目的，本申请提出一种训练数据的增强方法，所述方法包括：
[0005]获取训练数据集；
[0006]将所述训练数据集输入至分类模型进行预训练，获取分类错误的原始图像及分类数据；
[0007]将所述原始图像输入预设的残差网络...

【技术保护点】

【技术特征摘要】
1.一种训练数据的增强方法，其特征在于，所述方法包括：获取训练数据集；将所述训练数据集输入至分类模型进行预训练，获取分类错误的原始图像及分类数据；将所述原始图像输入预设的残差网络，获取所述原始图像的特征；根据所述分类数据计算所述特征的互信息，并根据所述互信息筛选所述特征中影响度大于预设值的虚假特征；根据所述虚假特征对所述原始图像进行数据增强，得到目标图像；根据所述目标图像生成增强训练数据集，以基于所述增强训练数据集对所述分类模型进行重新训练。2.根据权利要求1所述的训练数据的增强方法，其特征在于，所述根据所述互信息筛选所述特征中影响度大于预设值的虚假特征之后，还包括：将所述虚假特征输入至决策树进行训练；获取所述决策树中错误率最高的叶子节点，根据所述叶子节点确定目标虚假特征。3.根据权利要求2所述的训练数据的增强方法，其特征在于，所述根据所述虚假特征对所述原始图像进行数据增强，得到目标图像，包括：将所述目标虚假特征进行归一化，并将归一化后的目标虚假特征放大至与所述原始图像相同尺寸，得到热力图；将所述热力图与所述原始图像进行叠加融合以对所述原始图像进行数据增强，得到目标图像。4.根据权利要求3所述的训练数据的增强方法，其特征在于，所述将所述热力图与所述原始图像进行叠加融合以对所述原始图像进行数据增强，得到目标图像，包括：根据所述热力图对所述原始图像中所述虚假特征对应区域进行掩蔽处理以对所述原始图像进行数据增强，得到目标图像。5.根据权利要求1所述的训练数据的增强方法，其特征在于，所述根据所述分类数据计算所述特征的互信息，包括：获取所述分类数据中的错误标签数据；计算每个所述特征与所述错误标签数据之间的互信息...

【专利技术属性】
技术研发人员：郑喜民，王颖妮，舒畅，陈又新，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人