一种模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号:34948874 阅读:16 留言:0更新日期:2022-09-17 12:25
本说明书公开了一种模型训练方法、装置、设备及存储介质,通过根据待训练的推荐模型输出的各训练样本的预测推荐指标,从各训练样本中选择目标正样本以及目标负样本,将目标正样本的预测推荐指标与目标负样本的预测推荐指标之间的差异作为待优化项,并结合各训练样本的预测推荐指标以及各训练样本的标注之间的差异确定出的损失,训练推荐模型。可见,本方法引入了目标正样本的预测推荐指标以及目标负样本预测推荐指标之间的差异作为优化项,使得推荐模型的模型训练过程中不仅关注于各训练样本的预测推荐指标的准确性,还关注于将正样本的推荐次序排在负样本之前,达到将用户感兴趣的推荐信息排序靠前的目的。趣的推荐信息排序靠前的目的。趣的推荐信息排序靠前的目的。

【技术实现步骤摘要】
一种模型训练方法、装置、设备及存储介质


[0001]本说明书涉及计算机
,尤其涉及一种模型训练方法、装置、设备及存储介质。

技术介绍

[0002]在实际应用中,在用户可以通过终端浏览服务提供平台时,如何从海量信息中选择符合用户偏好的推荐信息,已经成为服务提供方需要解决的问题之一。
[0003]现有技术中,通常是基于用户的历史行为以及待推荐信息的特征,通过推荐模型预测用户对待推荐信息的推荐指标,进而根据预测的推荐指标将各待推荐信息进行排序,并展示给用户。
[0004]然而,推荐模型的任务是确定各待推荐信息的推荐指标,进而基于推荐指标对各待推荐信息进行排序,而目前的推荐模型在训练的过程中,仍以历史推荐信息的实际推荐指标和推荐模型输出的预测推荐指标之间的差异作为待优化项,这更关注于推荐模型的准确率,但却没有引入与推荐信息的排序相关的待优化项,这可能会导致训练出的推荐模型不能很好的将用户感兴趣的推荐信息排序靠前。

技术实现思路

[0005]本说明书提供一种模型训练方法、装置、设备及存储介质,以部分的解决现有技术存在的上述问题。
[0006]本说明书采用下述技术方案:
[0007]本说明书提供了一种模型训练方法,包括:
[0008]获取若干历史推荐信息作为各训练样本,以及获取若干历史推荐信息的实际推荐指标作为各训练样本的标注;
[0009]将各训练样本分别输入到待训练的推荐模型,得到各训练样本的预测推荐指标;
[0010]根据各训练样本的预测推荐指标与各训练样本的标注之间差异,确定损失;
[0011]从各训练样本中选择的目标正样本以及目标负样本;
[0012]根据所述目标正样本的预测推荐指标,与所述目标负样本的预测推荐指标之间的差异,确定待优化项;
[0013]根据所述损失以及所述待优化项,训练所述推荐模型。
[0014]可选地,从各训练样本中选择的目标正样本以及目标负样本,具体包括:
[0015]将所述各训练样本中实际推荐指标大于预设阈值的各训练样本,作为各正样本;并将除正样本外的各训练样本,作为各负样本;
[0016]遍历各正样本以及各负样本,将正样本与负样本两两组合,得到各样本对;
[0017]针对每个样本对,根据该样本对中的正样本的预测推荐指标,以及该样本对中的负样本的预测推荐指标之间的差异,确定该样本对的目标差异;
[0018]根据所述各样本对的目标差异,从各样本对中选择若干目标样本对,将所述目标
样本对包含的正负样本分别作为目标正样本和目标负样本。
[0019]可选地,根据所述目标正样本的预测推荐指标,与所述目标负样本的预测推荐指标之间的差异,确定待优化项,具体包括:
[0020]针对每个目标样本对,根据该目标样本对的目标差异,确定该目标样本对的目标差异对所述待优化项的重要性;
[0021]以该目标样本对的目标差异对所述待优化项的重要性为权重,对该目标样本对的目标差异加权;
[0022]根据各目标样本对的加权结果,确定所述待优化项。
[0023]可选地,所述方法还包括:
[0024]将所述各正样本中,预测推荐指标最小的正样本作为目标正样本;
[0025]将所述各负样本中,预测推荐指标最大的负样本作为目标负样本。
[0026]可选地,所述方法还包括:
[0027]将所述各正样本中,预测推荐指标最大的正样本作为目标正样本;
[0028]将所述各负样本中,预测推荐指标最大的负样本作为目标负样本。
[0029]可选地,根据所述损失以及所述待优化项,训练所述推荐模型,具体包括:
[0030]根据所述待优化项,确定所述待优化项的权重;
[0031]以所述损失最小化和加权后的待优化项最大化为训练目标,训练所述推荐模型。
[0032]可选地,所述方法还包括:
[0033]响应于用户的推荐请求,获取若干待推荐信息;
[0034]将各待推荐信息分别输入训练后的推荐模型,得到所述各待推荐信息对应的推荐指标;所述推荐模型是根据所述损失以及所述待优化项训练得到的;
[0035]将按照所述推荐指标排序的各待推荐信息返回给所述用户。
[0036]本说明书提供了一种模型训练装置,包括:
[0037]获取模块,用于获取若干历史推荐信息作为各训练样本,以及获取若干历史推荐信息的实际推荐指标作为各训练样本的标注;
[0038]预测推荐指标确定模块,用于将各训练样本分别输入到待训练的推荐模型,得到各训练样本的预测推荐指标;
[0039]损失确定模块,用于根据各训练样本的预测推荐指标与各训练样本的标注之间差异,确定损失;
[0040]选择模块,用于从各训练样本中选择的目标正样本以及目标负样本;
[0041]待优化项确定模块,用于根据所述目标正样本的预测推荐指标,与所述目标负样本的预测推荐指标之间的差异,确定待优化项;
[0042]训练模块,用于根据所述损失以及所述待优化项,训练所述推荐模型。
[0043]本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述模型训练方法。
[0044]本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述模型训练方法。
[0045]本说明书采用的上述至少一个技术方案能够达到以下有益效果:
[0046]本方法通过根据待训练的推荐模型输出的各训练样本的预测推荐指标,从各训练
样本中选择目标正样本以及目标负样本,将目标正样本的预测推荐指标与目标负样本的预测推荐指标之间的差异作为待优化项,并结合各训练样本的预测推荐指标以及各训练样本的标注之间的差异确定出的损失,训练推荐模型。可见,本方法基于各训练样本的预测推荐指标,从各训练样本中选择目标正样本以及目标负样本的方式,在推荐模型的待优化项中引入了目标正样本的预测推荐指标以及目标负样本预测推荐指标之间的差异,使得推荐模型的模型训练过程中不仅关注于各训练样本的预测推荐指标的准确性,还关注于将正样本的推荐次序排在负样本之前,达到将用户感兴趣的推荐信息排序靠前的目的。
附图说明
[0047]此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
[0048]图1为本说明书中一种模型训练方法的流程示意图;
[0049]图2为本说明书中一种推荐方法的流程示意图;
[0050]图3为本说明书提供的一种模型训练装置的示意图;
[0051]图4为本说明书提供的对应于图1的电子设备示意图。
具体实施方式
[0052]为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获取若干历史推荐信息作为各训练样本,以及获取若干历史推荐信息的实际推荐指标作为各训练样本的标注;将各训练样本分别输入到待训练的推荐模型,得到各训练样本的预测推荐指标;根据各训练样本的预测推荐指标与各训练样本的标注之间差异,确定损失;从各训练样本中选择的目标正样本以及目标负样本;根据所述目标正样本的预测推荐指标,与所述目标负样本的预测推荐指标之间的差异,确定待优化项;根据所述损失以及所述待优化项,训练所述推荐模型。2.如权利要求1所述的方法,其特征在于,从各训练样本中选择的目标正样本以及目标负样本,具体包括:将所述各训练样本中实际推荐指标大于预设阈值的各训练样本,作为各正样本;并将除正样本外的各训练样本,作为各负样本;遍历各正样本以及各负样本,将正样本与负样本两两组合,得到各样本对;针对每个样本对,根据该样本对中的正样本的预测推荐指标,以及该样本对中的负样本的预测推荐指标之间的差异,确定该样本对的目标差异;根据所述各样本对的目标差异,从各样本对中选择若干目标样本对,将所述目标样本对包含的正负样本分别作为目标正样本和目标负样本。3.如权利要求2所述的方法,其特征在于,根据所述目标正样本的预测推荐指标,与所述目标负样本的预测推荐指标之间的差异,确定待优化项,具体包括:针对每个目标样本对,根据该目标样本对的目标差异,确定该目标样本对的目标差异对所述待优化项的重要性;以该目标样本对的目标差异对所述待优化项的重要性为权重,对该目标样本对的目标差异加权;根据各目标样本对的加权结果,确定所述待优化项。4.如权利要求2所述的方法,其特征在于,所述方法还包括:将所述各正样本中,预测推荐指标最小的正样本作为目标正样本;将所述各负样本中,预测推荐指标最大的负样本作为目标负样本。5.如权利要求2所...

【专利技术属性】
技术研发人员:孙笑张博张晨睿江忻玺卢心笛杨林任瀚蔡明宸
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1