产品推荐模型训练方法、产品推荐方法、装置及存储介质制造方法及图纸

技术编号:39176843 阅读:7 留言:0更新日期:2023-10-27 08:24
本说明书公开了一种产品推荐模型训练方法、产品推荐方法、装置及存储介质,其中,该方法通过对至少一个用户历史行为序列进行数据增强,得到可以表征不同用户之间的第一表征距离值以及相同用户之间的第二表征距离值的至少两种增强历史行为序列,接着,利用第一表征距离值以及第二表征距离值确定产品推荐模型的损失函数的损失值,并且,基于可以表征第一表征距离值以及第二表征距离值的损失函数的损失值训练产品推荐模型,从而不断调整产品推荐模型,进而调整增强历史行为序列,以使增强历史行为序列更加贴近真实用户的行为兴趣偏好,直到产品推荐模型收敛。直到产品推荐模型收敛。直到产品推荐模型收敛。

【技术实现步骤摘要】
产品推荐模型训练方法、产品推荐方法、装置及存储介质


[0001]本说明书涉及机器学习
,尤其涉及一种产品推荐模型训练方法、产品推荐方法、装置及存储介质。

技术介绍

[0002]随着大数据的快速发展,各类商家开始根据用户的浏览、点击及购买等用户行为数据向用户推荐用户所需要的产品,但是这些方法依赖于大量的用户行为数据。在实际场景下,用户行为数据往往存在稀疏问题,而商家基于这些稀疏用户行为数据向用户推荐产品时,并不能提高产品的成交率。

技术实现思路

[0003]本说明书提供了一种产品推荐模型训练方法、产品推荐方法、装置及存储介质,可以解决用户行为数据存在稀疏问题,导致商家基于这些稀疏用户行为数据向用户推荐产品时,并不能提高产品成交率的技术问题,所述技术方案如下:
[0004]第一方面,本说明书实施例提供一种产品推荐模型训练方法,该方法包括:
[0005]获取至少一个用户历史行为序列,基于产品推荐模型分别对各用户的历史行为序列进行数据增强,得到每一个用户的历史行为序列对应的至少两种增强历史行为序列;
[0006]基于所述产品推荐模型确定各用户的增强历史行为序列对应的不同用户之间的第一表征距离值以及相同用户之间的第二表征距离值,以及基于所述第一表征距离值以及所述第二表征距离值确定所述产品推荐模型的损失函数的损失值;
[0007]基于所述损失函数的损失值训练所述产品推荐模型,直到所述产品推荐模型收敛。
[0008]第二方面,本说明书实施例提供一种产品推荐方法,该方法包括:
[0009]获取目标用户的目标用户历史行为序列,将所述目标用户历史行为序列输入产品推荐模型;
[0010]根据所述产品推荐模型的输出数据,确定所述目标用户历史行为序列对应的产品推荐结果;其中,所述产品推荐模型为上述任一实施例中所述的产品推荐模型训练方法训练得到的产品推荐模型。
[0011]第三方面,本说明书实施例提供一种产品推荐模型训练装置,该装置包括:
[0012]数据增强模块,适于获取至少一个用户历史行为序列,基于产品推荐模型分别对各用户的历史行为序列进行数据增强,得到每一个用户的历史行为序列对应的至少两种增强历史行为序列;
[0013]损失函数确定模块,适于基于所述产品推荐模型确定各用户的增强历史行为序列对应的不同用户之间的第一表征距离值以及相同用户之间的第二表征距离值,以及基于所述第一表征距离值以及所述第二表征距离值确定所述产品推荐模型的损失函数的损失值;
[0014]收敛模块,适于基于所述损失函数的损失值训练所述产品推荐模型,直到所述产
品推荐模型收敛。
[0015]第四方面,本说明书实施例提供一种产品推荐装置,该装置包括:
[0016]获取模块,适于获取目标用户的目标用户历史行为序列,将所述目标用户历史行为序列输入产品推荐模型;
[0017]推荐模块,适于根据所述产品推荐模型的输出数据,确定所述目标用户历史行为序列对应的产品推荐结果;其中,所述产品推荐模型为上述任一实施例中所述的产品推荐模型训练方法训练得到的产品推荐模型。
[0018]第五方面,本说明书实施例提供一种包含指令的计算机程序产品,当所述计算机程序产品在计算机或处理器上运行时,使得所述计算机或所述处理器执行上述的方法的步骤。
[0019]第六方面,本说明书实施例提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法的步骤。
[0020]第七方面,本说明书实施例提供一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序适于由处理器加载并执行上述的方法的步骤。
[0021]本说明书一些实施例提供的技术方案带来的有益效果至少包括:基于产品推荐模型确定不同用户之间的增强历史行为序列对应的的第一表征距离值以及相同用户之间的的增强历史行为序列对应的第二表征距离值,并根据第一表征距离值以及第二表征距离值确定产品推荐模型的损失函数的损失值。这样,基于损失函数的损失值训练产品推荐模型可以使历史行为序列用户经过数据增强后得到的不同用户之间的第一表征距离值拉远,相同用户之间的第二表征距离值拉近,从而使经过数据增强后得到的增强历史行为序列更能刻画同一用户的用户行为特征以及可以区分不同用户之间的用户行为特征,进而使产品推荐模型在用户行为数据存在稀疏问题时可以对用户的兴趣偏好进行有效的学习和刻画,从而为用户推荐合适的产品。
附图说明
[0022]为了更清楚地说明本说明书或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0023]图1为本说明书实施例提供的一种产品推荐模型训练方法的示例性系统架构图;
[0024]图2为本说明书实施例提供的一种产品推荐模型训练方法的流程示意图;
[0025]图3为本说明书实施例提供的又一种产品推荐模型训练方法的流程示意图
[0026]图4为本说明书实施例提供的一种第一表征距离值和第二表征距离值的确定方法的流程示意图;
[0027]图5为本说明书实施例提供的一种产品推荐模型的结构示意图;
[0028]图6为本说明书实施例提供的一种产品推荐模型的局部架构示意图;
[0029]图7为本说明书实施例提供的一种确定产品推荐模型的损失函数的损失值的流程示意图;
[0030]图8为本说明书实施例提供的另一种确定产品推荐模型的损失函数的损失值的流程示意图;
[0031]图9为本说明书实施例提供的一种数据增强的流程示意图;
[0032]图10为本说明书实施例提供的一种item mask的示意图;
[0033]图11为本说明书实施例提供的一种item reorder的示意图
[0034]图12为本说明书实施例提供的一种产品推荐方法的流程示意图;
[0035]图13为本说明书实施例提供的一种产品推荐模型训练装置的结构框图;
[0036]图14为本说明书实施例提供的一种产品推荐装置的结构框图;
[0037]图15为本说明书实施例提供的一种终端的结构示意图。
具体实施方式
[0038]为使得本说明书实施例的特征和优点能够更加的明显和易懂,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而非全部实施例。基于本说明书中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书实施例保护的范围。
[0039]下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书实施例相一致的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种产品推荐模型训练方法,所述方法包括:获取至少一个用户历史行为序列,基于产品推荐模型分别对各用户的历史行为序列进行数据增强,得到每一个用户的历史行为序列对应的至少两种增强历史行为序列;基于所述产品推荐模型确定各用户的增强历史行为序列对应的不同用户之间的第一表征距离值以及相同用户之间的第二表征距离值,以及基于所述第一表征距离值以及所述第二表征距离值确定所述产品推荐模型的损失函数的损失值;基于所述损失函数的损失值训练所述产品推荐模型,直到所述产品推荐模型收敛。2.根据权利要求1所述的产品推荐模型训练方法,所述基于所述产品推荐模型确定各用户的增强历史行为序列对应的不同用户之间的第一表征距离值以及相同用户之间的第二表征距离值,包括:基于相同用户的历史行为序列对应的至少两种增强历史行为序列确定各正样本对;基于不同用户的历史行为序列对应的增强历史行为序列确定各负样本对;基于所述产品推荐模型确定各负样本对对应的第一表征距离值,以及各正样本对对应的第二表征距离值。3.根据权利要求2所述的产品推荐模型训练方法,所述基于所述产品推荐模型确定各负样本对对应的第一表征距离值,以及各正样本对对应的第二表征距离值,包括:提取各负样本对对应的两个增强历史行为序列各自的行为特征,确定各负样本对对应的两个第一度量向量,基于各负样本对对应的两个第一度量向量的余弦距离,确定不同用户之间的各第一表征距离值;提取各正样本对对应的两个增强历史行为序列各自的行为特征,确定各正样本对对应的两个第二度量向量,基于各正样本对对应的两个第二度量向量的余弦距离,确定相同用户的各第二表征距离值。4.根据权利要求3所述的产品推荐模型训练方法,所述基于所述第一表征距离值以及所述第二表征距离值确定所述产品推荐模型的损失函数的损失值,包括:基于各正样本对的所述第二表征距离值确定各分子项以及基于与各正样本对对应的每个负样本对的第一表征距离值H0=S(z
i
,z
j
)确定分母项基于各分子项分别与所述分母项的比值确定各第一损失项L
i
=-log(A
i
/A0),基于各第一损失项确定所述产品推荐模型的损失函数的损失值;其中,i与j均表示互为负样本对的两个增强历史行为序列对应的编号;i=0,1,2
……
,K;K+1为增强历史行为序列的总数量;Z
i
和Z
i+
表示正样本对对应的两个第二度量向量;S(x,y)表示余弦距离函数;Z
i
和Z
j
表示负样本对对应的两个第一度量向量;温度系数τ是设定的超参数。5.根据权利要求4所述的产品推荐模型训练方法,所述产品推荐模型至少包括:曝光点击率预估子模型和点击转化率预估子模型;其中,所述曝光点击率预估子模型用于预测产品的曝光点击率,所述点击转化率预估子模型用于预测产品的点击转化率。
6.根据权利要求5所述的产品推荐模型训练方法,所述基于各第一损失项确定所述产品推荐模型的损失函数的损失值,包括:基于所述曝光点击率预估子模型、各用户历史行为序列及各增强历史行为序列确定所述曝光点击率预估子模型的曝光点击率损失函数;基于所述曝光点击率预估子模型、所述点击转化率预估子模型确定所述产品推荐模型的曝光转化率损失函数;基于所述曝光点击率损失函数、所述曝光转化率损失函数以及各第一损失项确定所述产品推荐模型的损失函数的损失值。7.根据权利要求6所述的产品推荐模型训练方法,所述基于所述曝光点击率损失函数、所述曝光转化率损失函数...

【专利技术属性】
技术研发人员:石雨菲熊万强吴军梅鵾
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1