多目标任务的机器学习模型训练方法、设备、介质和程序产品技术

技术编号：40803035 阅读：2 留言：0更新日期：2024-03-28 19:28

本公开提供了一种用于多目标任务的机器学习模型训练方法、设备、介质和程序产品。方法包括：计算多个目标任务中的每个目标任务的训练数据集各自的离散度；基于离散度确定该多个目标任务中的每个相应目标任务的损失函数的相应初始权重，初始权重与离散度负相关；基于相应初始权重对该多个目标任务的损失函数进行加权求和，以获得联合损失函数；以及基于联合损失函数对机器学习模型进行针对多个目标任务的训练，直至联合损失函数收敛为止。

全部详细技术资料下载

【技术实现步骤摘要】

本公开一般涉及机器学习领域，更具体涉及针对多目标任务的机器学习训练机制。

技术介绍

1、近年来，人工智能技术逐渐应用于越来越多的重要领域。在一些应用场景中，期望机器学习模型能够实现对多个目标的预测任务。以推荐系统为例，不仅需要预测用户的行为，例如点击、购买等，还要预测用户的满意度，例如评分、浏览感受和观看时长等。如果用多个模型预测多个目标，参数量会很大，而且线上难以对多个模型进行维护。因此，需要针对多目标任务的模型训练方法来通过单个模型预测多个目标。

技术实现思路

1、本专利技术的目的在于提出一种用于多目标任务的机器学习模型训练方法、设备、介质和程序产品。

2、根据本公开的一方面，提供了一种用于多目标任务的机器学习模型训练方法，所述方法包括：计算多个目标任务中的每个目标任务的训练数据集各自的离散度；基于所述离散度确定所述多个目标任务中的每个相应目标任务的损失函数的相应初始权重，所述初始权重与所述离散度负相关；基于所述相应初始权重对所述多个目标任务的损失函数进行加权求和，以获得联合损失函数；以及基于所述联合损失函数对所述机器学习模型进行针对所述多个目标任务的训练，直至所述联合损失函数收敛为止。

3、根据本公开的另一方面，提供了一种用于多目标任务的机器学习模型训练的电子设备，其特征在于，所述电子设备包括：处理器；和存储器，耦接到处理器并存储计算机程序指令，所述计算机程序指令在被处理器执行时使得处理器执行如下操作：计算多个目标任务中的每个目标任务的训练数据集各自的

4、根据本公开的另一方面，提供了一种计算机可读存储介质，存储有计算机程序指令，所述计算机程序指令在由一个或多个处理器执行时，使得一个或多个处理器执行前述方法。

5、根据本公开的另一方面，提供了一种计算机程序产品，包括计算机可执行指令，计算机可执行指令在由一个或多个处理器执行时，使得该一个或多个处理器执行前述方法。

6、根据本公开的实施例的优点在于，基于各目标任务的训练数据集的离散度来对各目标任务的损失函数进行加权求和，并基于加权求和得到的联合损失函数对机器学习模型进行训练，减缓了模型训练过程中由于不同目标任务的损失函数差异较大带来的“跷跷板”现象，提高了模型预测的准确率。

7、应当认识到，上述优点不需全部集中在一个或一些特定实施例中实现，而是可以部分分散在根据本公开的不同实施例中。根据本公开的实施例可以具有上述优点中的一个或一些，也可以替代地或者附加地具有其它的优点。

8、通过以下参照附图对本专利技术的示例性实施例的详细描述，本专利技术的其它特征及其优点将会变得更为清楚。

本文档来自技高网...

【技术保护点】

1.一种用于多目标任务的机器学习模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其中，所述多个目标任务的训练数据集的分布相同。

3.根据权利要求1所述的方法，其中，所述多个目标任务中的至少两个目标任务的训练数据集的分布不同。

4.根据权利要求1所述的方法，其中，所述离散度为标准差。

5.根据权利要求4所述的方法，其中，所述基于所述离散度确定所述多个目标任务中的每个相应目标任务的损失函数的相应初始权重包括：

6.根据权利要求5所述的方法，其中，所述联合损失函数通过如下公式确定：

7.根据权利要求3所述的方法，其中，所述基于所述联合损失函数对所述机器学习模型进行针对所述多个目标任务的训练，包括：

8.根据权利要求3所述的方法，其中，所述基于所述联合损失函数对所述机器学习模型进行针对所述多个目标任务的训练，包括：

9.根据权利要求8所述的方法，其中，所述更新后的相应权重与相应的所述概率分布相似度正相关。

10.根据权利要求8所述的方法，其中，所述概率分布相

11.根据权利要求1所述的方法，其中所述多个目标任务至少包括点击率预测任务和转化率预测任务中的一者，所述点击率预测任务的训练数据集包括用户历史点击数据和待预测物品的历史被点击数据，所述转化率预测任务的训练数据集包括用户历史点击后转化数据和待预测物品的点击后转化数据。

12.一种用于多目标任务的机器学习模型训练的电子设备，其特征在于，所述电子设备包括：

13.根据权利要求12所述的电子设备，其中，所述多个目标任务中的至少两个目标任务的训练数据集的分布不同。

14.根据权利要求13所述的电子设备，其中，所述基于所述联合损失函数对所述机器学习模型进行针对所述多个目标任务的训练，包括：

15.根据权利要求13所述的电子设备，其中，所述基于所述联合损失函数对所述机器学习模型进行针对所述多个目标任务的训练，包括：

16.根据权利要求15所述的电子设备，其中，所述更新后的相应权重与相应的所述概率分布相似度正相关。

17.根据权利要求15所述的电子设备，其中，所述概率分布相似度由JS散度表示，所述基于所述概率分布相似度得到权重缩放系数包括通过下式计算所述权重缩放系数：

18.一种计算机可读存储介质，存储有计算机程序指令，所述计算机程序指令在由一个或多个处理器执行时，使得所述一个或多个处理器执行根据权利要求1-11中任一项所述的方法。

19.一种计算机程序产品，包括计算机可执行指令，所述计算机可执行指令在由一个或多个处理器执行时，使得所述一个或多个处理器执行根据权利要求1-11中的任一项所述的方法。

...

【技术特征摘要】

1.一种用于多目标任务的机器学习模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其中，所述多个目标任务的训练数据集的分布相同。

3.根据权利要求1所述的方法，其中，所述多个目标任务中的至少两个目标任务的训练数据集的分布不同。

4.根据权利要求1所述的方法，其中，所述离散度为标准差。

5.根据权利要求4所述的方法，其中，所述基于所述离散度确定所述多个目标任务中的每个相应目标任务的损失函数的相应初始权重包括：

6.根据权利要求5所述的方法，其中，所述联合损失函数通过如下公式确定：

7.根据权利要求3所述的方法，其中，所述基于所述联合损失函数对所述机器学习模型进行针对所述多个目标任务的训练，包括：

8.根据权利要求3所述的方法，其中，所述基于所述联合损失函数对所述机器学习模型进行针对所述多个目标任务的训练，包括：

9.根据权利要求8所述的方法，其中，所述更新后的相应权重与相应的所述概率分布相似度正相关。

10.根据权利要求8所述的方法，其中，所述概率分布相似度由js散度表示，所述基于所述概率分布相似度得到权重缩放系数包括通过下式计算所述权重缩放系数：

11.根据权利要求1所述的方法，其中所述多个目标任务至少包括点击率预测任务和转化率预测任务中的一者，所述点击率预测任务的训练数据集包括用户历史点击数...

【专利技术属性】
技术研发人员：宋云龙，
申请(专利权)人：中国电信股份有限公司技术创新中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人