数据增强策略搜索方法、装置、设备以及存储介质制造方法及图纸

技术编号：25398846 阅读：35 留言：0更新日期：2020-08-25 23:04

本申请实施例公开了数据增强策略搜索方法、装置、设备以及存储介质，涉及人工智能技术领域。该方法的一具体实施方式包括：获取模型的训练脚本、训练数据集和数据增强策略配置信息；基于数据增强策略配置信息，生成数据增强策略搜索空间；在数据增强策略搜索空间中对训练数据集进行数据增强，以及利用数据增强的训练数据集对训练脚本进行模型训练，自动搜索数据增强策略搜索空间中的数据增强策略的目标增强值。该实施方式通过自动搜索的方式进行数据增强策略的搜索，大大缩短了为训练数据集选择较优的数据增强策略所花费的时间。

全部详细技术资料下载

【技术实现步骤摘要】
数据增强策略搜索方法、装置、设备以及存储介质
本申请实施例涉及计算机
，具体涉及人工智能

技术介绍
深度学习技术在很多方向上都取得了巨大的成功。在深度学习技术中，模型的训练数据集的数据增强策略对模型的性能和效果有着非常重要的影响。目前，几乎所有的模型在训练过程中都需要加入数据增强策略，以提升模型的精度和鲁棒性。而传统的数据增强策略设定严重依赖人工的干预，例如人工设定数据增强策略，并花费大量的时间进行多次调节，以得到较优的数据增强策略。
技术实现思路
本申请实施例提出了数据增强策略搜索方法、装置、设备以及存储介质。第一方面，本申请实施例提出了一种数据增强策略搜索方法，包括：获取模型的训练脚本、训练数据集和数据增强策略配置信息；基于数据增强策略配置信息，生成数据增强策略搜索空间；在数据增强策略搜索空间中对训练数据集进行数据增强，以及利用数据增强的训练数据集对训练脚本进行模型训练，自动搜索数据增强策略搜索空间中的数据增强策略的目标增强值。第二方面，本申请实施例提出了一种数据增强策略搜索装置，包括：模型信息获取模块，被配置成获取模型的训练脚本、训练数据集和数据增强策略配置信息；搜索空间生成模块，被配置成基于数据增强策略配置信息，生成数据增强策略搜索空间；增强策略搜索模块，被配置成在数据增强策略搜索空间中对训练数据集进行数据增强，以及利用数据增强的训练数据集对训练脚本进行模型训练，自动搜索数据增强策略搜索空间中的数据增强策略的目标增强值。第三方面，本申请实施例...

【技术保护点】
1.一种数据增强策略搜索方法，包括：/n获取模型的训练脚本、训练数据集和数据增强策略配置信息；/n基于所述数据增强策略配置信息，生成数据增强策略搜索空间；/n在所述数据增强策略搜索空间中对所述训练数据集进行数据增强，以及利用数据增强的训练数据集对所述训练脚本进行模型训练，自动搜索所述数据增强策略搜索空间中的数据增强策略的目标增强值。/n

【技术特征摘要】
1.一种数据增强策略搜索方法，包括：
获取模型的训练脚本、训练数据集和数据增强策略配置信息；
基于所述数据增强策略配置信息，生成数据增强策略搜索空间；
在所述数据增强策略搜索空间中对所述训练数据集进行数据增强，以及利用数据增强的训练数据集对所述训练脚本进行模型训练，自动搜索所述数据增强策略搜索空间中的数据增强策略的目标增强值。

2.根据权利要求1所述的方法，其中，所述在所述数据增强策略搜索空间中对所述训练数据集进行数据增强，以及利用数据增强的训练数据集对所述训练脚本进行模型训练，自动搜索所述数据增强策略搜索空间中的数据增强策略的目标增强值，包括：
对于所述数据增强策略搜索空间中的数据增强策略的候选增强值，将所述训练数据集作为第一组件，调用该候选增强值进行数据增强，得到该候选增强值对应的训练数据集，以及将所述训练脚本作为第二组件，调用该的候选增强值对应的训练数据集进行模型训练，得到该候选增强值对应的模型；
将满足预设效果的模型对应的候选增强值确定为所述目标增强值。

3.根据权利要求1所述的方法，其中，所述获取数据增强策略配置信息，包括：
将所述数据增强策略配置信息作为第三组件，以及从组件化配置信息提交接口获取所述数据增强策略配置信息，其中，所述数据增强策略配置信息的提交方式包括在线提交或命令行提交。

4.根据权利要求1所述的方法，其中，所述方法还包括：
利用所述目标增强值对所述训练数据集进行数据增强，得到目标训练数据集；
利用所述目标训练数据集进行训练，得到目标模型。

5.根据权利要求1-4之一所述的方法，其中，数据增强策略包括以下至少一种：水平翻转、垂直翻转、随机剪裁、高斯模糊、图像锐度和图像旋转。

6.一种数据增强策略搜索装置，包括：
模型信息获取模块，被配置成获取模型的训练脚本、训练数据集和数据增强策略配置信息；
搜索空间生成模块，被配置成基于所...

【专利技术属性】
技术研发人员：希滕，张刚，温圣召，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人