【技术实现步骤摘要】
本说明书涉及计算机,尤其涉及一种模型训练和业务执行方法、装置、存储介质及设备。
技术介绍
1、随着人工智能技术的发展,深度学习模型在诸如图像识别、自然语言处理、异常检测以及隐私保护等业务中发挥着越来越重要的作用,在模型的训练过程中,样本数据的质量、数量和分布对模型的性能具有重要影响。因此,数据采样技术应运而生,该技术通过指定数据采样策略下的采样概率,对不同来源或类型的数据集进行采样,从而优化训练数据的分布。
2、然而,现有的数据采样方法通常会基于固定的数据采样策略在不同的数据集中对样本数据进行采样,但是随着训练过程中模型参数的不断更新,基于与以往训练轮次相同的数据采样策略得到的相近样本数据很难使模型的性能得到进一步的提升,导致模型的训练效率低下,甚至会影响到模型的准确性。
3、因此,如何避免固定数据采样策略对模型训练效率和性能所带来的影响,是一个亟待解决的问题。
技术实现思路
1、本说明书提供一种模型训练和业务执行方法、装置、存储介质及设备,以基于每轮对模型训练时得
...【技术保护点】
1.一种模型训练方法,包括:
2.如权利要求1所述的方法,根据所述业务模型在该轮训练的损失值,确定对所述业务模型进行下一轮训练时所使用的数据采样策略,具体包括:
3.如权利要求2所述的方法,根据该轮训练对应数据采样策略的奖励值,确定对所述业务模型进行下一轮训练时所使用的数据采样策略,具体包括:
4.如权利要求3所述的方法,根据该轮训练对应的数据采样策略的奖励值以及对所述业务模型进行下一轮训练时针对数据采样策略的探索率,确定对所述业务模型进行下一轮训练时所使用的数据采样策略,具体包括:
5.如权利要求3所述的方法,当对所述
...【技术特征摘要】
1.一种模型训练方法,包括:
2.如权利要求1所述的方法,根据所述业务模型在该轮训练的损失值,确定对所述业务模型进行下一轮训练时所使用的数据采样策略,具体包括:
3.如权利要求2所述的方法,根据该轮训练对应数据采样策略的奖励值,确定对所述业务模型进行下一轮训练时所使用的数据采样策略,具体包括:
4.如权利要求3所述的方法,根据该轮训练对应的数据采样策略的奖励值以及对所述业务模型进行下一轮训练时针对数据采样策略的探索率,确定对所述业务模型进行下一轮训练时所使用的数据采样策略,具体包括:
5.如权利要求3所述的方法,当对所述业务模型进行训练的训练轮次数超过指定训练轮次数后,数据采样策略的探索率随着训练轮次数的增加而减小。
6.如权利要求2所述的方法,根据所述业务模型在该轮训练的损失值以及在该轮训练对应的数据采样策略...
【专利技术属性】
技术研发人员:郑行,陈跃鹤,王智信,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。