一种推荐模型的训练方法及装置制造方法及图纸

技术编号:38126760 阅读:13 留言:0更新日期:2023-07-08 09:31
本公开涉及人工智能技术领域,提供了一种推荐模型的训练方法、装置、计算机设备及计算机可读存储介质。该方法可以根据不同的样本类型设置不同的损失函数权重值,以便对所述推荐模型进行训练的过程中,可以减少不影响模型训练效果的样本类型的训练推荐样本的损失函数权重值,以及提高对模型训练效果影响较大的样本类型的训练推荐样本的损失函数权重值,以充分发挥对模型训练效果影响较大的样本类型的训练推荐样本的潜力,减少对模型训练效果没有影响或者影响较差的样本类型的训练推荐样本对于推荐模型训练的影响,以便可以提升了推荐模型的训练效率和效果,进而提升推荐模型的性能,进一步提高实际业务场景中推荐模型的推荐效果。效果。效果。

【技术实现步骤摘要】
一种推荐模型的训练方法及装置


[0001]本公开涉及人工智能
,尤其涉及一种推荐模型的训练方法及装置。

技术介绍

[0002]在线上电子商务业务中,如何根据用户的个性化特征推荐合适的商品或服务给用户一直是一个重要课题。在某些相对低频场景下,如线上广告、线上租房、买房等场景下,由于样本数据稀疏,正样本比较少,负样本的数量会远高于正样本的数量,其中,大部分都是对网络训练作用相对较小的易分负样本。大量比较容易区分的负样本,对于模型的训练并无增益,而且会导致模型的过拟合,在线上泛化能力降低。

技术实现思路

[0003]有鉴于此,本公开实施例提供了一种推荐模型的训练方法、装置、计算机设备及计算机可读存储介质,以解决现有技术的推荐模型训练过程中由于大量比较容易区分的负样本,对于模型的训练并无增益,而且会导致模型的过拟合,在线上泛化能力降低的问题。
[0004]本公开实施例的第一方面,提供了一种推荐模型的训练方法,所述方法包括:
[0005]获取训练推荐样本集;其中,所述训练推荐样本集包括若干训练推荐样本,每组训练推荐样本包括用户属性信息、商品属性信息、交互行为信息以及真实推荐转化结果;
[0006]利用所述训练推荐样本集对预设的推荐模型进行N轮训练,得到所述训练推荐样本集中每组训练推荐样本分别在每一轮训练中的损失函数值;
[0007]根据所述训练推荐样本集中每组训练推荐样本分别在每一轮训练中的损失函数值,确定每组训练推荐样本的样本类型;
[0008]利用所述训练推荐样本集、所述训练推荐样本集中每组训练推荐样本的样本类型和预设的样本类型对应的损失函数权重值,对所述推荐模型进行训练,得到已训练的推荐模型。
[0009]本公开实施例的第二方面,提供了一种推荐模型的训练装置,所述装置包括:
[0010]集合获取单元,用于获取训练推荐样本集;其中,所述训练推荐样本集包括若干训练推荐样本,每组训练推荐样本包括用户属性信息、商品属性信息、交互行为信息以及真实推荐转化结果;
[0011]数值确定单元,用于利用所述训练推荐样本集对预设的推荐模型进行N轮训练,得到所述训练推荐样本集中每组训练推荐样本分别在每一轮训练中的损失函数值;
[0012]类型确定单元,用于根据所述训练推荐样本集中每组训练推荐样本分别在每一轮训练中的损失函数值,确定每组训练推荐样本的样本类型;
[0013]模型训练单元,用于利用所述训练推荐样本集、所述训练推荐样本集中每组训练推荐样本的样本类型和预设的样本类型对应的损失函数权重值,对所述推荐模型进行训练,得到已训练的推荐模型。
[0014]本公开实施例的第三方面,提供了一种计算机设备,包括存储器、处理器以及存储
在存储器中并且可以在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
[0015]本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
[0016]本公开实施例与现有技术相比存在的有益效果是:本公开实施例可以先获取训练推荐样本集;其中,所述训练推荐样本集包括若干训练推荐样本,每组训练推荐样本包括用户属性信息、商品属性信息、交互行为信息以及真实推荐转化结果。然后,利用所述训练推荐样本集对预设的推荐模型进行N轮训练,得到所述训练推荐样本集中每组训练推荐样本分别在每一轮训练中的损失函数值。接着,根据所述训练推荐样本集中每组训练推荐样本分别在每一轮训练中的损失函数值,确定每组训练推荐样本的样本类型。最后,利用所述训练推荐样本集、所述训练推荐样本集中每组训练推荐样本的样本类型和预设的样本类型对应的损失函数权重值,对所述推荐模型进行训练,得到已训练的推荐模型。可见,本实施例中先利用每组训练推荐样本中的用户属性信息、商品属性信息、交互行为信息以及真实推荐转化结果,确定每组训练推荐样本分别在每一轮训练中的损失函数值,然后,依据每组训练推荐样本分别在每一轮训练中的损失函数值为每组训练推荐样本进行分类,确定组训练推荐样本的样本类型;这样,对训练推荐样本进行了充分的全局分析和挖掘,通过对训练推荐样本在第一阶段训练过程中(即N轮训练)的损失函数值进行分类,甄别出不同的样本类型(比如简单样本,普通样本和难样本),由于不同样本类型的训练推荐样本对于推荐模型的训练效果的影响程度(比如影响推荐模型的泛化能力)不同,因此,可以根据不同的样本类型设置不同的损失函数权重值,以便在利用所述训练推荐样本集、所述训练推荐样本集中每组训练推荐样本的样本类型和预设的样本类型对应的损失函数权重值,对所述推荐模型进行训练的过程中,可以减少不影响模型训练效果的样本类型的训练推荐样本的损失函数权重值,以及提高对模型训练效果影响较大的样本类型的训练推荐样本的损失函数权重值,以充分发挥对模型训练效果影响较大的样本类型的训练推荐样本的潜力,减少对模型训练效果没有影响或者影响较差的样本类型的训练推荐样本对于推荐模型训练的影响;可见,本实施例可以有效改善不同样本类型的训练推荐样本的训练权重(即损失函数权重值)分布,从而让推荐模型的训练过程更为充分,可以提升了推荐模型的训练效率和效果,进而提升推荐模型的性能,进一步提高实际业务场景中推荐模型的推荐效果(比如提高推荐模型的推荐精准度)。
附图说明
[0017]为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0018]图1是本公开实施例的应用场景的场景示意图;
[0019]图2是本公开实施例提供的推荐模型的训练方法的流程图;
[0020]图3是本公开实施例提供的推荐模型的训练装置的框图;
[0021]图4是本公开实施例提供的计算机设备的示意图。
具体实施方式
[0022]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本公开实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本公开的描述。
[0023]下面将结合附图详细说明根据本公开实施例的一种推荐模型的训练方法和装置。
[0024]在现有技术中,由于传统的推荐模型的训练方法,在某些相对低频场景下,如线上广告、线上租房、买房等场景下,由于样本数据稀疏,正样本比较少,负样本的数量会远高于正样本的数量,其中,大部分都是对网络训练作用相对较小的易分负样本。大量比较容易区分的负样本,对于模型的训练并无增益,而且会导致模型的过拟合,在线上泛化能力降低。也就是说,现有的训练方式中没有很好地挖掘和利用不同样本类型的训练样本,从而很大程度上影响了推荐模型的泛化本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种推荐模型的训练方法,其特征在于,所述方法包括:获取训练推荐样本集;其中,所述训练推荐样本集包括若干训练推荐样本,每组训练推荐样本包括用户属性信息、商品属性信息、交互行为信息以及真实推荐转化结果;利用所述训练推荐样本集对预设的推荐模型进行N轮训练,得到所述训练推荐样本集中每组训练推荐样本分别在每一轮训练中的损失函数值;根据所述训练推荐样本集中每组训练推荐样本分别在每一轮训练中的损失函数值,确定每组训练推荐样本的样本类型;利用所述训练推荐样本集、所述训练推荐样本集中每组训练推荐样本的样本类型和预设的样本类型对应的损失函数权重值,对所述推荐模型进行训练,得到已训练的推荐模型。2.根据权利要求1所述的方法,其特征在于,所述推荐模型包括多层全连通神经网络。3.根据权利要求1所述的方法,其特征在于,所述利用所述训练推荐样本集对预设的推荐模型进行N轮训练,得到所述训练推荐样本集中每组训练推荐样本分别在每一轮训练中的损失函数值,包括:针对所述训练推荐样本集中的每组训练推荐样本的每一轮训练,将所述训练推荐样本中的用户属性信息、商品属性信息和交互行为信息输入预设的推荐模型,得到所述用户属性信息、所述商品属性信息和所述交互行为信息对应的预测推荐转化结果;根据所述训练推荐样本中的真实推荐转化结果和所述预测推荐转化结果,确定本轮训练的损失函数值。4.根据权利要求1所述的方法,其特征在于,所述根据所述训练推荐样本集中每组训练推荐样本分别在每一轮训练中的损失函数值,确定每组训练推荐样本的样本类型,包括:针对所述训练推荐样本集中的每组训练推荐样本,根据所述训练推荐样本分别在每一轮训练中的损失函数值,确定所述训练推荐样本的训练全程损失下降度;根据所述训练推荐样本集中的各个训练推荐样本的训练全程损失下降度,确定每组训练推荐样本的样本类型。5.根据权利要求4所述的方法,其特征在于,所述根据所述训练推荐样本分别在每一轮训练中的损失函数值,确定所述训练推荐样本的训练全程损失下降度,包括:根据所述训练推荐样本分别在每一轮训练中的损失函数值,确定前M轮训练的损失函数值平均值和后X轮训练的损失函数值,其中,M、X均小于N;根据所述前M轮训练的损失函数值平均值和所述后X轮训练的损失函数值,确定所述训...

【专利技术属性】
技术研发人员:暴宇健董辉
申请(专利权)人:北京龙智数科科技服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1