多目标任务的机器学习模型训练方法、设备、介质和程序产品技术

技术编号:40803035 阅读:20 留言:0更新日期:2024-03-28 19:28
本公开提供了一种用于多目标任务的机器学习模型训练方法、设备、介质和程序产品。方法包括:计算多个目标任务中的每个目标任务的训练数据集各自的离散度;基于离散度确定该多个目标任务中的每个相应目标任务的损失函数的相应初始权重,初始权重与离散度负相关;基于相应初始权重对该多个目标任务的损失函数进行加权求和,以获得联合损失函数;以及基于联合损失函数对机器学习模型进行针对多个目标任务的训练,直至联合损失函数收敛为止。

【技术实现步骤摘要】

本公开一般涉及机器学习领域,更具体涉及针对多目标任务的机器学习训练机制。


技术介绍

1、近年来,人工智能技术逐渐应用于越来越多的重要领域。在一些应用场景中,期望机器学习模型能够实现对多个目标的预测任务。以推荐系统为例,不仅需要预测用户的行为,例如点击、购买等,还要预测用户的满意度,例如评分、浏览感受和观看时长等。如果用多个模型预测多个目标,参数量会很大,而且线上难以对多个模型进行维护。因此,需要针对多目标任务的模型训练方法来通过单个模型预测多个目标。


技术实现思路

1、本专利技术的目的在于提出一种用于多目标任务的机器学习模型训练方法、设备、介质和程序产品

2、根据本公开的一方面,提供了一种用于多目标任务的机器学习模型训练方法,所述方法包括:计算多个目标任务中的每个目标任务的训练数据集各自的离散度;基于所述离散度确定所述多个目标任务中的每个相应目标任务的损失函数的相应初始权重,所述初始权重与所述离散度负相关;基于所述相应初始权重对所述多个目标任务的损失函数进行加权求和,以获得联合损失函数;以及基于本文档来自技高网...

【技术保护点】

1.一种用于多目标任务的机器学习模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其中,所述多个目标任务的训练数据集的分布相同。

3.根据权利要求1所述的方法,其中,所述多个目标任务中的至少两个目标任务的训练数据集的分布不同。

4.根据权利要求1所述的方法,其中,所述离散度为标准差。

5.根据权利要求4所述的方法,其中,所述基于所述离散度确定所述多个目标任务中的每个相应目标任务的损失函数的相应初始权重包括:

6.根据权利要求5所述的方法,其中,所述联合损失函数通过如下公式确定:

<p>7.根据权利要求...

【技术特征摘要】

1.一种用于多目标任务的机器学习模型训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其中,所述多个目标任务的训练数据集的分布相同。

3.根据权利要求1所述的方法,其中,所述多个目标任务中的至少两个目标任务的训练数据集的分布不同。

4.根据权利要求1所述的方法,其中,所述离散度为标准差。

5.根据权利要求4所述的方法,其中,所述基于所述离散度确定所述多个目标任务中的每个相应目标任务的损失函数的相应初始权重包括:

6.根据权利要求5所述的方法,其中,所述联合损失函数通过如下公式确定:

7.根据权利要求3所述的方法,其中,所述基于所述联合损失函数对所述机器学习模型进行针对所述多个目标任务的训练,包括:

8.根据权利要求3所述的方法,其中,所述基于所述联合损失函数对所述机器学习模型进行针对所述多个目标任务的训练,包括:

9.根据权利要求8所述的方法,其中,所述更新后的相应权重与相应的所述概率分布相似度正相关。

10.根据权利要求8所述的方法,其中,所述概率分布相似度由js散度表示,所述基于所述概率分布相似度得到权重缩放系数包括通过下式计算所述权重缩放系数:

11.根据权利要求1所述的方法,其中所述多个目标任务至少包括点击率预测任务和转化率预测任务中的一者,所述点击率预测任务的训练数据集包括用户历史点击数...

【专利技术属性】
技术研发人员:宋云龙
申请(专利权)人:中国电信股份有限公司技术创新中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1