一种推荐模型的训练方法及装置、一种推荐方法及装置制造方法及图纸

技术编号:21687501 阅读:63 留言:0更新日期:2019-07-24 15:02
本申请提供的一种推荐模型的训练方法及装置、一种推荐方法及装置,其中,所述推荐模型的训练方法包括确定待训练的推荐模型中训练参数的第一初始参数值,其中,所述第一初始参数值为预先训练的点击率预估模型迭代更新初始参数值后的目标参数值;获取至少两个样本用户的用户特征以及至少两个样本应用程序的属性特征;基于用户特征、属性特征生成样本用户对曝光的样本应用程序购买的正样本以及样本用户对曝光的样本应用程序未购买的负样本;基于包括至少一个正样本和负样本的样本集合和所述第一初始参数值对待训练的推荐模型进行训练,得到所述推荐模型,所述推荐模型输出每个样本用户对每个样本应用程序的曝光转化率。

A Training Method and Device of Recommendation Model, a Recommendation Method and Device

【技术实现步骤摘要】
一种推荐模型的训练方法及装置、一种推荐方法及装置
本申请涉及计算机
,特别涉及一种推荐模型的训练方法及装置、一种推荐方法及装置、一种计算设备及计算机可读存储介质。
技术介绍
在一些互联网产品中,为了便于用户快速找到自己想要的商品(例如APP),需要进行个性化推荐,将用户最可能点击购买的APP推荐给待推荐用户。目前,一些平台在进行APP推荐的时候简单的根据用户及APP的标签,使用传统的机器学习模型(例如:LR或GBDT模型)进行推荐,这种利用标签进行推荐的方式需要花费大量人力来建立标签体系,并且容易给用户推荐不适合的APP(例如:黄赌毒的APP),并且没有充分利用点击后的购买数据,可能会造成点击率高的APP被用户点击后的购买转化率较低。
技术实现思路
有鉴于此,本说明书实施例提供了一种推荐模型的训练方法及装置、一种推荐方法及装置、一种计算设备及计算机可读存储介质,以解决现有技术中存在的技术缺陷。第一方面,本说明书实施例公开了一种推荐模型的训练方法,包括:确定待训练的推荐模型中训练参数的第一初始参数值,其中,所述第一初始参数值为预先训练的点击率预估模型迭代更新初始参数值后的目标参数值;获取至少两个样本用户的用户特征以及至少两个样本应用程序的属性特征;基于用户特征、属性特征生成样本用户对曝光的样本应用程序购买的正样本以及样本用户对曝光的样本应用程序未购买的负样本;基于包括至少一个正样本和负样本的样本集合和所述第一初始参数值对待训练的推荐模型进行训练,得到所述推荐模型,所述推荐模型输出每个样本用户对每个样本应用程序的曝光转化率。可选地,预先训练所述点击率预估模型包括以下步骤:确定待训练的点击率预估模型中训练参数的第二初始参数值;获取至少两个样本用户的用户特征以及至少两个样本应用程序的属性特征;基于用户特征、属性特征生成样本用户对曝光的样本应用程序点击的正样本以及样本用户对曝光的样本应用程序未点击的负样本;基于包括至少一个正样本和负样本的样本集合和所述第二初始参数值对待训练的点击率预估模型进行训练,得到所述点击率预估模型,所述训练包括基于预设更新策略迭代更新所述第二初始参数值后,得到目标参数值。可选地,基于包括至少一个正样本和负样本的样本集合和所述第一初始参数值对待训练的推荐模型进行训练之前,还包括:基于预设筛选规则将所述样本集合筛选为包括至少一个正样本和负样本的训练样本集合以及包括至少一个正样本和负样本的测试样本集合。可选地,基于包括至少一个正样本和负样本的样本集合和所述第一初始参数值对待训练的推荐模型进行训练,得到所述推荐模型包括:基于包括至少一个正样本和负样本的训练样本集合和所述第一初始参数值对待训练的推荐模型进行训练,得到所述推荐模型。可选地,基于包括至少一个正样本和负样本的样本集合和所述第一初始参数值对待训练的推荐模型进行训练,得到所述推荐模型之后,还包括:基于包括至少一个正样本和负样本的测试样本集合对所述推荐模型进行测试。可选地,所述推荐模型和所述点击率预估模型均采用DeepFM模型结构。可选地,所述用户特征和所述属性特征均包括离线特征和实时特征,其中,所述离线特征包括采集的所述样本用户以及所述样本应用程序的历史特征,所述实时特征包括采集的所述样本用户以及所述样本应用程序在事件发生时的特征。第二方面,本说明书一实施例还提供了一种推荐方法,包括:接收待推荐用户对曝光的应用程序的推荐请求,其中,所述待推荐用户携带有用户标识;基于所述用户标识确定与所述待推荐用户匹配的至少两个待推荐应用程序;提取所述待推荐用户的用户特征以及所述至少两个待推荐应用程序的属性特征;将所述用户特征和所述属性特征输入到预先训练的推荐模型中,得到所述待推荐用户对每个匹配的待推荐应用程序的曝光转化率;基于所述曝光转化率将所述至少两个待推荐应用程序中的至少一个待推荐应用程序作为曝光的应用程序推荐给待推荐用户。可选地,接收待推荐用户对曝光的应用程序的推荐请求之前,还包括:获取多个携带有标识的应用程序;基于第一预设条件对所述多个应用程序进行筛选,确定至少两个待推荐应用程序。可选地,确定至少两个待推荐应用程序之后,还包括:基于预设匹配规则将待推荐用户与所述至少两个待推荐应用程序进行匹配,其中,所述待推荐用户携带有用户标识。可选地,所述推荐模型采用DeepFM模型结构。可选地,基于所述曝光转化率将所述至少两个待推荐应用程序中的至少一个待推荐应用程序作为曝光的应用程序推荐给待推荐用户包括:基于所述曝光转化率对所述至少两个待推荐应用程序进行排序;基于预设推荐条件选择所述至少两个待推荐应用程序中的至少一个待推荐应用程序作为曝光的应用程序推荐给待推荐用户。可选地,基于所述曝光转化率对所述至少两个待推荐应用程序进行排序之后,还包括:基于所述第二预设条件对所述至少两个待推荐应用程序进行筛选;基于预设推荐条件选择所述至少两个待推荐应用程序中的至少一个待推荐应用程序作为曝光的应用程序推荐给待推荐用户包括:基于预设推荐条件选择筛选后的所述至少两个待推荐应用程序中的至少一个待推荐应用程序作为曝光的应用程序推荐给待推荐用户。可选地,所述用户特征和所述属性特征均包括离线特征和实时特征,其中,所述离线特征包括采集的所述待推荐用户以及所述待推荐应用程序的历史特征,所述实时特征包括采集的所述待推荐用户以及所述待推荐应用程序在当前时刻的特征。第三方面,本说明书一实施例还提供了一种推荐模型的训练装置,包括:第一初始参数值确定模块,被配置为确定待训练的推荐模型中训练参数的第一初始参数值,其中,所述第一初始参数值为预先训练的点击率预估模型迭代更新初始参数值后的目标参数值;第一获取模块,被配置为获取至少两个样本用户的用户特征以及至少两个样本应用程序的属性特征;第一生成模块,被配置为基于用户特征、属性特征生成样本用户对曝光的样本应用程序购买的正样本以及样本用户对曝光的样本应用程序未购买的负样本;第一模型训练模块,被配置为基于包括至少一个正样本和负样本的样本集合和所述第一初始参数值对待训练的推荐模型进行训练,得到所述推荐模型,所述推荐模型输出每个样本用户对每个样本应用程序的曝光转化率。可选地,所述第一初始参数值确定模块包括:第二初始参数值确定子模块,被配置为确定待训练的点击率预估模型中训练参数的第二初始参数值;第二获取子模块,被配置为获取至少两个样本用户的用户特征以及至少两个样本应用程序的属性特征;第二生成子模块,被配置为基于用户特征、属性特征生成样本用户对曝光的样本应用程序点击的正样本以及样本用户对曝光的样本应用程序未点击的负样本;第二模型训练子模块,被配置为基于包括至少一个正样本和负样本的样本集合和所述第二初始参数值对待训练的点击率预估模型进行训练,得到所述点击率预估模型,所述训练包括基于预设更新策略迭代更新所述第二初始参数值后,得到目标参数值。可选地,所述装置还包括:样本数据筛选模块,被配置为基于预设筛选规则将所述样本集合筛选为包括至少一个正样本和负样本的训练样本集合以及包括至少一个正样本和负样本的测试样本集合。可选地,所述第一模型训练模块,进一步被配置为:基于包括至少一个正样本和负样本的训练样本集合和所述第一初始参数值对待训练的推荐模型进行训练,得到所述推荐模型。本文档来自技高网...

【技术保护点】
1.一种推荐模型的训练方法,其特征在于,包括:确定待训练的推荐模型中训练参数的第一初始参数值,其中,所述第一初始参数值为预先训练的点击率预估模型迭代更新初始参数值后的目标参数值;获取至少两个样本用户的用户特征以及至少两个样本应用程序的属性特征;基于用户特征、属性特征生成样本用户对曝光的样本应用程序购买的正样本以及样本用户对曝光的样本应用程序未购买的负样本;基于包括至少一个正样本和负样本的样本集合和所述第一初始参数值对待训练的推荐模型进行训练,得到所述推荐模型,所述推荐模型输出每个样本用户对每个样本应用程序的曝光转化率。

【技术特征摘要】
1.一种推荐模型的训练方法,其特征在于,包括:确定待训练的推荐模型中训练参数的第一初始参数值,其中,所述第一初始参数值为预先训练的点击率预估模型迭代更新初始参数值后的目标参数值;获取至少两个样本用户的用户特征以及至少两个样本应用程序的属性特征;基于用户特征、属性特征生成样本用户对曝光的样本应用程序购买的正样本以及样本用户对曝光的样本应用程序未购买的负样本;基于包括至少一个正样本和负样本的样本集合和所述第一初始参数值对待训练的推荐模型进行训练,得到所述推荐模型,所述推荐模型输出每个样本用户对每个样本应用程序的曝光转化率。2.根据权利要求1所述的方法,其特征在于,预先训练所述点击率预估模型包括以下步骤:确定待训练的点击率预估模型中训练参数的第二初始参数值;获取至少两个样本用户的用户特征以及至少两个样本应用程序的属性特征;基于用户特征、属性特征生成样本用户对曝光的样本应用程序点击的正样本以及样本用户对曝光的样本应用程序未点击的负样本;基于包括至少一个正样本和负样本的样本集合和所述第二初始参数值对待训练的点击率预估模型进行训练,得到所述点击率预估模型,所述训练包括基于预设更新策略迭代更新所述第二初始参数值后,得到目标参数值。3.根据权利要求1所述的方法,其特征在于,基于包括至少一个正样本和负样本的样本集合和所述第一初始参数值对待训练的推荐模型进行训练之前,还包括:基于预设筛选规则将所述样本集合筛选为包括至少一个正样本和负样本的训练样本集合以及包括至少一个正样本和负样本的测试样本集合。4.根据权利要求3所述的方法,其特征在于,基于包括至少一个正样本和负样本的样本集合和所述第一初始参数值对待训练的推荐模型进行训练,得到所述推荐模型包括:基于包括至少一个正样本和负样本的训练样本集合和所述第一初始参数值对待训练的推荐模型进行训练,得到所述推荐模型。5.根据权利要求4所述的方法,其特征在于,基于包括至少一个正样本和负样本的样本集合和所述第一初始参数值对待训练的推荐模型进行训练,得到所述推荐模型之后,还包括:基于包括至少一个正样本和负样本的测试样本集合对所述推荐模型进行测试。6.根据权利要求1或2任一所述的方法,其特征在于,所述推荐模型和所述点击率预估模型均采用DeepFM模型结构。7.根据权利要求1或2任一所述的方法,其特征在于,所述用户特征和所述属性特征均包括离线特征和实时特征,其中,所述离线特征包括采集的所述样本用户以及所述样本应用程序的历史特征,所述实时特征包括采集的所述样本用户以及所述样本应用程序在事件发生时的特征。8.一种推荐方法,其特征在于,包括:接收待推荐用户对曝光的应用程序的推荐请求,其中,所述待推荐用户携带有用户标识;基于所述用户标识确定与所述待推荐用户匹配的至少两个待推荐应用程序;提取所述待推荐用户的用户特征以及所述至少两个待推荐应用程序的属性特征;将所述用户特征和所述属性特征输入到预先训练的推荐模型中,得到所述待推荐用户对每个匹配的待推荐应用程序的曝光转化率;基于所述曝光转化率将所述至少两个待推荐应用程序中的至少一个待推荐应用程序作为曝光的应用程序推荐给待推荐用户。9.根据权利要求8所述的方法,其特征在于,接收待推荐用户对曝光的应用程序的推荐请求之前,还包括:获取多个携带有标识的应用程序;基于第一预设条件对所述多个应用程序进行筛选,确定至少两个待推荐应用程序。10.根据权利要求9所述的方法,其特征在于,确定至少两个待推荐应用程序之后,还包括:基于预设匹配规则将待推荐用户与所述至少两个待推荐应用程序进行匹配,其中,所述待推荐用户携带有用户标识。11.根据权利要求8-10任一所述的方法,其特征在于,所述推荐模型采用DeepFM模型结构。12.根据权利要求11所述的方法,其特征在于,基于所述曝光转化率将所述至少两个待推荐应用程序中的至少一个待推荐应用程序作为曝光的应用程序推荐给待推荐用户包括:基于所述曝光转化率对所述至少两个待推荐应用程序进行排序;基于预设推荐条件选择所述至少两个待推荐应用程序中的至少一个待推荐应用程序作为曝光的应用程序推荐给待推荐用户。13.根据权利要求12所述的方法,其特征在于,基于所述曝光转化率对所述至少两个待推荐应用程序进行排序之后,还包括:基于所述第二预设条件对所述至少两个待推荐应用程序进行筛选;基于预设推荐条件选择所述至少两个待推荐应用程序中的至少一个待推荐应用程序作为曝光的应用程序推荐给待推荐用户包括:基于预设推荐条件选择筛选后的所述至少两个待推荐应用程序中的至少一个待推荐应用程序作为曝光的应用程序推荐给待推荐用户。14.根据权利要求8所述的方法,其特征在于,所述用户特征和所述属性特征均包括离线特征和实时特征,其中,所述离线特征包括采集的所述待推荐用户以及所述待推荐应用程序的历史特征,所述实时特征包括采集的所述待推荐用户以及所述待推荐应用程序在当前时刻的特征。15.一种推荐模型的训练装置,其特征在于,包括:第一初始参数值确定模块,被配置为确定待训练的推荐模型中训练参数的第一初始参数值,其中,所...

【专利技术属性】
技术研发人员:谢仁强
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1