【技术实现步骤摘要】
数据增强策略的更新方法、装置、设备及存储介质
本公开的实施例涉及机器学习领域,尤其涉及一种数据增强策略的更新方法、装置、设备及存储介质。
技术介绍
深度学习技术的应用效果依赖于大量的训练数据,在数量有限的训练数据上训练得到的数据处理模型,通常会出现过度拟合现象。为了提高数据处理模型的训练效果、并降低模型训练所需的人力,自动数据增强技术逐渐被用来提高训练数据的数据量和多样性。自动数据增强技术是指通过自动机器学习技术自动化数据增强过程,因此,找到一个合适的数据增强策略非常关键。通常的,可基于数据处理模型的训练效果,通过强化学习算法对数据增强策略进行优化。由于训练数据的量级通常比较大、且数据处理模型训练的也比较耗时,数据增强策略的生成效率还有待提高。
技术实现思路
本公开的实施例提供一种数据增强策略的更新方法、装置、设备及存储介质,用以解决数据增强策略的生成效率不高的问题。第一方面,本公开的实施例提供一种数据增强策略的更新方法,包括:获取初始的数据增强策略;根据所述数据增 ...
【技术保护点】
1.一种数据增强策略的更新方法,其特征在于,所述方法包括:/n获取初始的数据增强策略;/n根据所述数据增强策略和预设的训练数据,对预设的经过第一阶段训练的数据处理模型进行第二阶段训练;/n根据经过第二阶段训练的数据处理模型,对所述数据增强策略进行更新,以得到更新后的数据增强策略。/n
【技术特征摘要】
1.一种数据增强策略的更新方法,其特征在于,所述方法包括:
获取初始的数据增强策略;
根据所述数据增强策略和预设的训练数据,对预设的经过第一阶段训练的数据处理模型进行第二阶段训练;
根据经过第二阶段训练的数据处理模型,对所述数据增强策略进行更新,以得到更新后的数据增强策略。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取第M次更新的所述数据增强策略,所述M大于等于1;
根据第M次更新的所述数据增强策略和所述训练数据,对所述经过第一阶段训练的数据处理模型进行第二阶段训练;
根据经过第二阶段训练的数据增强模型,对所述数据增强策略进行第M+1次更新。
3.根据权利要求2所述的方法,其特征在于,所述初始的数据增强策略的数量为多个,各所述数据增强策略的更新并行进行;所述方法还包括:
每预设的更新次数,根据所述经过第二阶段训练的数据处理模型,在更新后的各所述数据增强策略中,选取最优的数据增强策略;
在更新后的所述数据增强策略中,将除所述最优的数据增强策略之外的各所述数据增强策略分别替换为所述最优的数据增强策略。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述数据增强策略包括多个预设的数据增强操作;所述根据所述数据增强策略和预设的训练数据,对预设的经过第一阶段训练的数据处理模型进行第二阶段训练,包括:
按照各所述数据增强操作,依次对所述训练数据进行数据增强;
通过数据增强后的所述训练数据,对所述经过第一阶段训练的数据处理模型进行第二阶段训练。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述根据经过第二阶段训练的数据处理模型,对所述数据增强策略进行更新,包括:
根据所述经过第二阶段训练的数据处理模型,更新预设的策略模型;
通过更新后的所述策略模型,确定各个预设策略的选中概率;
按照各所述预设策略的选中概率,在所述预设策略中选取更新后的所述数据增强策略。
6.根据权利要求5所述的方法,其特征在于,在所述数据增强策略的更新次数为多次的情况下,所述根据经过第二阶段训练的数据处理模型,更新预设的策略模型,包括:
根据预设的验证数据,对所述经过第二阶段训练的数据处理模型进行检验,得到检验结果;
获取所述数据增强策略的前N-1次更新中所述经过第二阶段的数据处理模型的历史检验结果,所述N为所述数据增强策略当前更新的总次数;
根据所述历史检验结果和所述检验结果,对所述策略模型进行更新。
7.根据权利要求6所述的方法,其特征在于,所述根据所述历史检验结果和所述检验结果,对所述策略模型进行更新,包括:
计算所述历史检验结果的均值;
计算所述检验结果和所述均值的差值;
根据所述差值,对所述策略模型中的策略参数进行更新。
8.根据权利要求1-3任一项所述的方法...
【专利技术属性】
技术研发人员:田柯宇,林宸,孙明,闫俊杰,
申请(专利权)人:北京市商汤科技开发有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。