产品推荐模型训练方法、产品推荐方法、装置及存储介质制造方法及图纸

技术编号：39176843 阅读：7 留言：0更新日期：2023-10-27 08:24

本说明书公开了一种产品推荐模型训练方法、产品推荐方法、装置及存储介质，其中，该方法通过对至少一个用户历史行为序列进行数据增强，得到可以表征不同用户之间的第一表征距离值以及相同用户之间的第二表征距离值的至少两种增强历史行为序列，接着，利用第一表征距离值以及第二表征距离值确定产品推荐模型的损失函数的损失值，并且，基于可以表征第一表征距离值以及第二表征距离值的损失函数的损失值训练产品推荐模型，从而不断调整产品推荐模型，进而调整增强历史行为序列，以使增强历史行为序列更加贴近真实用户的行为兴趣偏好，直到产品推荐模型收敛。直到产品推荐模型收敛。直到产品推荐模型收敛。

全部详细技术资料下载

【技术实现步骤摘要】
产品推荐模型训练方法、产品推荐方法、装置及存储介质

[0001]本说明书涉及机器学习
，尤其涉及一种产品推荐模型训练方法、产品推荐方法、装置及存储介质。

技术介绍

[0002]随着大数据的快速发展，各类商家开始根据用户的浏览、点击及购买等用户行为数据向用户推荐用户所需要的产品，但是这些方法依赖于大量的用户行为数据。在实际场景下，用户行为数据往往存在稀疏问题，而商家基于这些稀疏用户行为数据向用户推荐产品时，并不能提高产品的成交率。

技术实现思路

[0003]本说明书提供了一种产品推荐模型训练方法、产品推荐方法、装置及存储介质，可以解决用户行为数据存在稀疏问题，导致商家基于这些稀疏用户行为数据向用户推荐产品时，并不能提高产品成交率的技术问题，所述技术方案如下：
[0004]第一方面，本说明书实施例提供一种产品推荐模型训练方法，该方法包括：
[0005]获取至少一个用户历史行为序列，基于产品推荐模型分别对各用户的历史行为序列进行数据增强，得到每一个用户的历史行为序列对应的至少两种增强历史行为序列；
[0006]基于所述产品推荐模型确定各用户的增强历史行为序列对应的不同用户之间的第一表征距离值以及相同用户之间的第二表征距离值，以及基于所述第一表征距离值以及所述第二表征距离值确定所述产品推荐模型的损失函数的损失值；
[0007]基于所述损失函数的损失值训练所述产品推荐模型，直到所述产品推荐模型收敛。
[0008]第二方面，本说明书实施例提供一种产品推荐方法，该方法包...

【技术保护点】

【技术特征摘要】
1.一种产品推荐模型训练方法，所述方法包括：获取至少一个用户历史行为序列，基于产品推荐模型分别对各用户的历史行为序列进行数据增强，得到每一个用户的历史行为序列对应的至少两种增强历史行为序列；基于所述产品推荐模型确定各用户的增强历史行为序列对应的不同用户之间的第一表征距离值以及相同用户之间的第二表征距离值，以及基于所述第一表征距离值以及所述第二表征距离值确定所述产品推荐模型的损失函数的损失值；基于所述损失函数的损失值训练所述产品推荐模型，直到所述产品推荐模型收敛。2.根据权利要求1所述的产品推荐模型训练方法，所述基于所述产品推荐模型确定各用户的增强历史行为序列对应的不同用户之间的第一表征距离值以及相同用户之间的第二表征距离值，包括：基于相同用户的历史行为序列对应的至少两种增强历史行为序列确定各正样本对；基于不同用户的历史行为序列对应的增强历史行为序列确定各负样本对；基于所述产品推荐模型确定各负样本对对应的第一表征距离值，以及各正样本对对应的第二表征距离值。3.根据权利要求2所述的产品推荐模型训练方法，所述基于所述产品推荐模型确定各负样本对对应的第一表征距离值，以及各正样本对对应的第二表征距离值，包括：提取各负样本对对应的两个增强历史行为序列各自的行为特征，确定各负样本对对应的两个第一度量向量，基于各负样本对对应的两个第一度量向量的余弦距离，确定不同用户之间的各第一表征距离值；提取各正样本对对应的两个增强历史行为序列各自的行为特征，确定各正样本对对应的两个第二度量向量，基于各正样本对对应的两个第二度量向量的余弦距离，确定相同用户的各第二表征距离值。4.根据权利要求3所述的产品推荐模型训练方法，所述基于所述第一表征距离值以及所述第二表征距离值确定所述产品推荐模型的损失函数的损失值，包括：基于各正样本对的所述第二表征距离值确定各分子项以及基于与各正样本对对应的每个负样本对的第一表征距离值H0＝S(z
i
,z
j
)确定分母项基于各分子项分别与所述分母项的比值确定各第一损失项L
i
＝－log(A
i
/A0)，基于各第一损失项确定所述产品推荐模型的损失函数的损失值；其中，i与j均表示互为负样本对的两个增强历史行为序列对应的编号；i＝0，1，2
……
，K；K+1为增强历史行为序列的总数量；Z
i
和Z
i+
表示正样本对对应的两个第二度量向量；S(x，y)表示余弦距离函数；Z
i
和Z
j
表示负样本对对应的两个第一度量向量；温度系数τ是设定的超参数。5.根据权利要求4所述的产品推荐模型训练方法，所述产品推荐模型至少包括：曝光点击率预估子模型和点击转化率预估子模型；其中，所述曝光点击率预估子模型用于预测产品的曝光点击率，所述点击转化率预估子模型用于预测产品的点击转化率。
6.根据权利要求5所述的产品推荐模型训练方法，所述基于各第一损失项确定所述产品推荐模型的损失函数的损失值，包括：基于所述曝光点击率预估子模型、各用户历史行为序列及各增强历史行为序列确定所述曝光点击率预估子模型的曝光点击率损失函数；基于所述曝光点击率预估子模型、所述点击转化率预估子模型确定所述产品推荐模型的曝光转化率损失函数；基于所述曝光点击率损失函数、所述曝光转化率损失函数以及各第一损失项确定所述产品推荐模型的损失函数的损失值。7.根据权利要求6所述的产品推荐模型训练方法，所述基于所述曝光点击率损失函数、所述曝光转化率损失函数...

【专利技术属性】
技术研发人员：石雨菲，熊万强，吴军，梅鵾，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人