一种模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号：34948874 阅读：16 留言：0更新日期：2022-09-17 12:25

本说明书公开了一种模型训练方法、装置、设备及存储介质，通过根据待训练的推荐模型输出的各训练样本的预测推荐指标，从各训练样本中选择目标正样本以及目标负样本，将目标正样本的预测推荐指标与目标负样本的预测推荐指标之间的差异作为待优化项，并结合各训练样本的预测推荐指标以及各训练样本的标注之间的差异确定出的损失，训练推荐模型。可见，本方法引入了目标正样本的预测推荐指标以及目标负样本预测推荐指标之间的差异作为优化项，使得推荐模型的模型训练过程中不仅关注于各训练样本的预测推荐指标的准确性，还关注于将正样本的推荐次序排在负样本之前，达到将用户感兴趣的推荐信息排序靠前的目的。趣的推荐信息排序靠前的目的。趣的推荐信息排序靠前的目的。

全部详细技术资料下载

【技术实现步骤摘要】
一种模型训练方法、装置、设备及存储介质

[0001]本说明书涉及计算机
，尤其涉及一种模型训练方法、装置、设备及存储介质。

技术介绍

[0002]在实际应用中，在用户可以通过终端浏览服务提供平台时，如何从海量信息中选择符合用户偏好的推荐信息，已经成为服务提供方需要解决的问题之一。
[0003]现有技术中，通常是基于用户的历史行为以及待推荐信息的特征，通过推荐模型预测用户对待推荐信息的推荐指标，进而根据预测的推荐指标将各待推荐信息进行排序，并展示给用户。
[0004]然而，推荐模型的任务是确定各待推荐信息的推荐指标，进而基于推荐指标对各待推荐信息进行排序，而目前的推荐模型在训练的过程中，仍以历史推荐信息的实际推荐指标和推荐模型输出的预测推荐指标之间的差异作为待优化项，这更关注于推荐模型的准确率，但却没有引入与推荐信息的排序相关的待优化项，这可能会导致训练出的推荐模型不能很好的将用户感兴趣的推荐信息排序靠前。

技术实现思路

[0005]本说明书提供一种模型训练方法、装置、设备及存储介质，以部分的解决现有技术存在的上述问题。
[0006]本说明书采用下述技术方案：
[0007]本说明书提供了一种模型训练方法，包括：
[0008]获取若干历史推荐信息作为各训练样本，以及获取若干历史推荐信息的实际推荐指标作为各训练样本的标注；
[0009]将各训练样本分别输入到待训练的推荐模型，得到各训练样本的预测推荐指标；
[0010]根据各训练样本的预测推荐指标...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，包括：获取若干历史推荐信息作为各训练样本，以及获取若干历史推荐信息的实际推荐指标作为各训练样本的标注；将各训练样本分别输入到待训练的推荐模型，得到各训练样本的预测推荐指标；根据各训练样本的预测推荐指标与各训练样本的标注之间差异，确定损失；从各训练样本中选择的目标正样本以及目标负样本；根据所述目标正样本的预测推荐指标，与所述目标负样本的预测推荐指标之间的差异，确定待优化项；根据所述损失以及所述待优化项，训练所述推荐模型。2.如权利要求1所述的方法，其特征在于，从各训练样本中选择的目标正样本以及目标负样本，具体包括：将所述各训练样本中实际推荐指标大于预设阈值的各训练样本，作为各正样本；并将除正样本外的各训练样本，作为各负样本；遍历各正样本以及各负样本，将正样本与负样本两两组合，得到各样本对；针对每个样本对，根据该样本对中的正样本的预测推荐指标，以及该样本对中的负样本的预测推荐指标之间的差异，确定该样本对的目标差异；根据所述各样本对的目标差异，从各样本对中选择若干目标样本对，将所述目标样本对包含的正负样本分别作为目标正样本和目标负样本。3.如权利要求2所述的方法，其特征在于，根据所述目标正样本的预测推荐指标，与所述目标负样本的预测推荐指标之间的差异，确定待优化项，具体包括：针对每个目标样本对，根据该目标样本对的目标差异，确定该目标样本对的目标差异对所述待优化项的重要性；以该目标样本对的目标差异对所述待优化项的重要性为权重，对该目标样本对的目标差异加权；根据各目标样本对的加权结果，确定所述待优化项。4.如权利要求2所述的方法，其特征在于，所述方法还包括：将所述各正样本中，预测推荐指标最小的正样本作为目标正样本；将所述各负样本中，预测推荐指标最大的负样本作为目标负样本。5.如权利要求2所...

【专利技术属性】
技术研发人员：孙笑，张博，张晨睿，江忻玺，卢心笛，杨林，任瀚，蔡明宸，
申请(专利权)人：北京三快在线科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人