一种模型训练和业务执行方法、装置、存储介质及设备制造方法及图纸

技术编号：45494047 阅读：18 留言：0更新日期：2025-06-10 17:50

本说明书公开了一种模型训练和业务执行方法、装置、存储介质及设备，该模型训练方法包括：针对业务模型除第一轮训练外所进行的每轮训练，基于上一轮对业务模型进行训练时得到的损失值，确定该轮训练对应的数据采样策略；基于该轮训练的数据采样策略，在不同的业务数据集中对样本数据进行采样，得到该轮训练的样本数据；将样本数据输入业务模型，确定针对样本数据的预测结果；根据预测结果，确定业务模型的损失值并对业务模型进行训练，以及，根据业务模型在该轮训练的损失值，确定对业务模型进行下一轮训练时所使用的数据采样策略。本方案通过模型训练过程中的损失值对采样策略进行动态更新，保证了模型训练效率。

全部详细技术资料下载

【技术实现步骤摘要】

本说明书涉及计算机，尤其涉及一种模型训练和业务执行方法、装置、存储介质及设备。

技术介绍

1、随着人工智能技术的发展，深度学习模型在诸如图像识别、自然语言处理、异常检测以及隐私保护等业务中发挥着越来越重要的作用，在模型的训练过程中，样本数据的质量、数量和分布对模型的性能具有重要影响。因此，数据采样技术应运而生，该技术通过指定数据采样策略下的采样概率，对不同来源或类型的数据集进行采样，从而优化训练数据的分布。

2、然而，现有的数据采样方法通常会基于固定的数据采样策略在不同的数据集中对样本数据进行采样，但是随着训练过程中模型参数的不断更新，基于与以往训练轮次相同的数据采样策略得到的相近样本数据很难使模型的性能得到进一步的提升，导致模型的训练效率低下，甚至会影响到模型的准确性。

3、因此，如何避免固定数据采样策略对模型训练效率和性能所带来的影响，是一个亟待解决的问题。

技术实现思路

1、本说明书提供一种模型训练和业务执行方法、装置、存储介质及设备，以基于每轮对模型训练时得...

【技术保护点】

1.一种模型训练方法，包括：

2.如权利要求1所述的方法，根据所述业务模型在该轮训练的损失值，确定对所述业务模型进行下一轮训练时所使用的数据采样策略，具体包括：

3.如权利要求2所述的方法，根据该轮训练对应数据采样策略的奖励值，确定对所述业务模型进行下一轮训练时所使用的数据采样策略，具体包括：

4.如权利要求3所述的方法，根据该轮训练对应的数据采样策略的奖励值以及对所述业务模型进行下一轮训练时针对数据采样策略的探索率，确定对所述业务模型进行下一轮训练时所使用的数据采样策略，具体包括：

5.如权利要求3所述的方法，当对所述业务模型进行训练的训...

【技术特征摘要】

1.一种模型训练方法，包括：

2.如权利要求1所述的方法，根据所述业务模型在该轮训练的损失值，确定对所述业务模型进行下一轮训练时所使用的数据采样策略，具体包括：

3.如权利要求2所述的方法，根据该轮训练对应数据采样策略的奖励值，确定对所述业务模型进行下一轮训练时所使用的数据采样策略，具体包括：

5.如权利要求3所述的方法，当对所述业务模型进行训练的训练轮次数超过指定训练轮次数后，数据采样策略的探索率随着训练轮次数的增加而减小。

6.如权利要求2所述的方法，根据所述业务模型在该轮训练的损失值以及在该轮训练对应的数据采样策略...

【专利技术属性】
技术研发人员：郑行，陈跃鹤，王智信，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人