用于向用户推荐项目的方法、装置和存储介质制造方法及图纸

技术编号:24412729 阅读:21 留言:0更新日期:2020-06-06 09:58
本发明专利技术涉及用于向用户推荐项目的方法、装置和存储介质。本发明专利技术提出了一种用于向用户推荐项目的推荐模型训练方法。该方法包括:获取多个样本,多个样本中的每一个包括用户特征、项目组和与项目组相对应的标签,项目组包括二个或更多个项目,标签指示用户是否选中项目组;为项目组中的每个项目生成各自的项目嵌入向量;对生成的多个项目嵌入向量进行加权平均以得到项目组的综合嵌入向量;基于用户特征生成用户的用户嵌入向量;以及使用得到的综合嵌入向量、用户的用户嵌入向量和与项目组相对应的标签来训练用以向用户推荐项目的推荐模型。该推荐模型能够实现项目的精准推荐。

Methods, devices, and storage media for recommending items to users

【技术实现步骤摘要】
用于向用户推荐项目的方法、装置和存储介质
本专利技术涉及人工智能和机器学习的
,特别是涉及向用户推荐项目的方法、装置和存储介质。
技术介绍
动态商品广告(DynamicProductAds)DPA是可以根据用户的喜好和兴趣采用推荐算法向用户展示感兴趣商品的广告,其本质上是一种项目与用户的匹配过程。现有的商品推荐算法是基于神经网络的算法,其将用户特征和商品特征输入神经网络中,并输出0~1之间的数字以表示该商品被该用户点击的概率。对于一条广告仅展示一个商品的情况,可以直接确定该商品被点击的概率。然而,在多商品广告,即一条广告展示多个商品的情况下,现有技术中随机选择多个商品中的一个作为训练样本,这传递了错误信息给推荐模型,使推荐模型的效果变差;或将多个商品拆分成多条样本,这样不仅使得数据量变多,推荐模型训练速度变慢,还可能产生假阳性样本。因此,现有方法不能在不丢失输入信息的前提下保证输入推荐模型的训练数据的准确性。
技术实现思路
本专利技术的实施例至少部分地解决上面提及的问题。根据本专利技术的第一方面,提出了一种用于向用户推荐项目的推荐模型训练方法。该方法包括:获取多个样本,多个样本中的每一个包括用户特征、项目组和与项目组相对应的标签,项目组包括二个或更多个项目,标签指示用户是否选中项目组;为项目组中的每个项目生成各自的项目嵌入向量;对生成的多个项目嵌入向量进行加权平均以得到项目组的综合嵌入向量;基于用户特征生成用户的用户嵌入向量;以及使用得到的综合嵌入向量、用户的用户嵌入向量和与项目组相对应的标签来训练用以向用户推荐项目的推荐模型。在一些实施例中,为项目组中的每个项目生成各自的项目嵌入向量包括:针对每个项目的特征进行编码得到每个项目的项目特征嵌入向量,和基于项目特征嵌入向量生成每个项目各自的项目嵌入向量。在一些实施例中,针对每个项目的特征进行编码得到每个项目的项目特征嵌入向量包括:针对各个项目基于相同的编码词表来针对每个项目的特征进行编码得到每个项目的项目特征嵌入向量。在一些实施例中,推荐模型包括针对用户的第一神经网络结构,第一神经网络结构包括一个或多个激活函数层。在一些实施例中,推荐模型包括针对项目组中的每个项目的相应第二神经网络结构,每个第二神经网络结构包括一个或多个激活函数层。在一些实施例中,对生成的多个项目嵌入向量进行加权平均以得到项目组的综合嵌入向量包括:对生成的多个项目嵌入向量进行算数平均以得到项目组的综合嵌入向量。在一些实施例中,对生成的多个项目嵌入向量进行加权平均以得到项目组的综合嵌入向量包括:以经训练得到的权重作为各个项目嵌入向量的权重,对生成的多个项目嵌入向量进行加权平均以得到项目组的综合嵌入向量。在一些实施例中,使用得到的综合嵌入向量、用户的用户嵌入向量和与项目组相对应的标签来训练推荐模型包括:对综合嵌入向量和用户的用户嵌入向量进行点积运算得到点积结果;基于点积结果与项目组相对应的标签计算损失函数;以及对推荐模型中的参数进行调整以使损失函数收敛。在一些实施例中,基于点积结果与项目组相对应的标签计算损失函数包括:对点积结果进行归一化,和基于经归一化的点积结果与项目组相对应的标签计算损失函数。在一些实施例中,项目包括商品、电影和文章。根据本专利技术的第二方面,提出了一种用于向用户推荐项目的方法。该方法包括:获取目标用户的目标用户特征和待推荐项目的项目特征;和使用推荐模型基于目标用户特征和项目特征确定向目标用户推荐该项目的概率,其中,在使用推荐模型之前,方法还包括:获取多个样本,多个样本中的每一个包括样本用户特征、项目组和与项目组相对应的标签,项目组包括二个或更多个项目,标签指示样本用户是否选中项目组;为项目组中的每个样本项目生成各自的项目嵌入向量;对生成的多个项目嵌入向量进行加权平均以得到项目组的综合嵌入向量;基于样本用户特征生成样本用户的用户嵌入向量;使用得到的综合嵌入向量、样本用户的用户嵌入向量和与项目组相对应的标签来训练推荐模型。根据本专利技术的第三方面,提出了一种用于向用户推荐项目的推荐模型训练装置。该装置包括:获取模块,被配置成获取多个样本,多个样本中的每一个包括用户特征、项目组和与项目组相对应的标签,项目组包括二个或更多个项目,标签指示用户是否选中项目组;项目嵌入向量生成模块,被配置成为项目组中的每个项目生成各自的项目嵌入向量;综合嵌入向量生成模块,被配置成对生成的多个项目嵌入向量进行加权平均以得到项目组的综合嵌入向量;用户嵌入向量生成模块,被配置成基于用户特征生成用户的用户嵌入向量;以及训练模块,被配置成使用得到的综合嵌入向量、用户的用户嵌入向量和与项目组相对应的标签来训练用以向用户推荐项目的推荐模型。根据本专利技术的第四方面,提出了一种用于向用户推荐项目的装置。该装置包括:获取模块,被配置成获取目标用户的目标用户特征和待推荐项目的项目特征;和推荐概率计算模块,被配置成使用推荐模型基于目标用户特征和项目特征确定向目标用户推荐该项目的概率;训练模块,被配置成在使用推荐模型之前,执行下述步骤:获取多个样本,多个样本中的每一个包括样本用户特征、项目组和与项目组相对应的标签,项目组包括二个或更多个项目,标签指示样本用户是否选中项目组;为项目组中的每个样本项目生成各自的项目嵌入向量;对生成的多个项目嵌入向量进行加权平均以得到项目组的综合嵌入向量;基于样本用户特征生成样本用户的用户嵌入向量;使用得到的综合嵌入向量、样本用户的用户嵌入向量和与项目组相对应的标签来训练推荐模型。根据本专利技术的一些实施例,提供了一种计算机设备,包括:处理器;以及存储器,其上存储有指令,指令当在处理器上执行时促使处理器执行如上的方法中的任一个。根据本专利技术的一些实施例,提供了一种计算机可读存储介质,其上存储有指令,指令当在处理器上执行时促使处理器执行如上的方法中的任一个。本专利技术提出的向用户推荐项目的方法、装置和计算机介质通过在用户-项目双塔结构中将包含多项目的项目组作为一条训练样本输入,针对每个项目维护各自的隐层网络,以及引入项目组的综合嵌入向量,可以在保证算法时效性的前提下,不丢失项目信息且不引入假阳性样本,实现了项目的精准推荐。本专利技术中向用户推荐项目的方法通过计算项目组的综合嵌入向量考虑多个项目对点击的共同贡献。训练模型效果在模型评估指标曲线下面积AUC(areaunderthecurve)等方面均有1~3%点的提升,同时保证了推荐模型的时效性,增强了用户体验。附图说明现将参考附图以非限制性示例的方式更加详细地描述本专利技术的实施例,附图仅仅是示意性的,并且其中相同的附图标记始终指代相同部分,在附图中:图1示出了一条多商品广告的示意图;图2示出了根据本专利技术一个实施例的广告投放的用户界面示意图;图3示出了根据一个实施例的用户-项目双塔模型的示意图;图4示出了根据另一个实施例的用户-项目双塔模型的示意图;图5示出了根据一个实施例的用于向用户推荐项目的推荐模型训练方法的流程图;本文档来自技高网...

【技术保护点】
1.一种用于向用户推荐项目的推荐模型训练方法,包括:/n获取多个样本,所述多个样本中的每一个包括用户特征、项目组和与所述项目组相对应的标签,所述项目组包括二个或更多个项目,所述标签指示所述用户是否选中所述项目组;/n为所述项目组中的每个项目生成各自的项目嵌入向量;/n对生成的多个所述项目嵌入向量进行加权平均以得到所述项目组的综合嵌入向量;/n基于所述用户特征生成所述用户的用户嵌入向量;以及/n使用得到的所述综合嵌入向量、所述用户的用户嵌入向量和所述与所述项目组相对应的标签来训练用以向所述用户推荐项目的推荐模型。/n

【技术特征摘要】
1.一种用于向用户推荐项目的推荐模型训练方法,包括:
获取多个样本,所述多个样本中的每一个包括用户特征、项目组和与所述项目组相对应的标签,所述项目组包括二个或更多个项目,所述标签指示所述用户是否选中所述项目组;
为所述项目组中的每个项目生成各自的项目嵌入向量;
对生成的多个所述项目嵌入向量进行加权平均以得到所述项目组的综合嵌入向量;
基于所述用户特征生成所述用户的用户嵌入向量;以及
使用得到的所述综合嵌入向量、所述用户的用户嵌入向量和所述与所述项目组相对应的标签来训练用以向所述用户推荐项目的推荐模型。


2.根据权利要求1所述的方法,其中所述为所述项目组中的每个项目生成各自的项目嵌入向量包括:针对所述每个项目的特征进行编码得到每个项目的项目特征嵌入向量,和基于所述项目特征嵌入向量生成每个项目各自的项目嵌入向量。


3.根据权利要求2所述的方法,其中所述针对所述每个项目的特征进行编码得到每个项目的项目特征嵌入向量包括:针对各个项目基于相同的编码词表来针对所述每个项目的特征进行编码得到每个项目的项目特征嵌入向量。


4.根据权利要求1所述的方法,其中所述推荐模型包括针对所述用户的第一神经网络结构,所述第一神经网络结构包括一个或多个激活函数层。


5.根据权利要求1所述的方法,其中所述推荐模型包括针对所述项目组中的每个项目的相应第二神经网络结构,每个第二神经网络结构包括一个或多个激活函数层。


6.根据权利要求1所述的方法,其中所述对生成的多个所述项目嵌入向量进行加权平均以得到所述项目组的综合嵌入向量包括:对生成的多个所述项目嵌入向量进行算数平均以得到所述项目组的综合嵌入向量。


7.根据权利要求1所述的方法,其中所述对生成的多个所述项目嵌入向量进行加权平均以得到所述项目组的综合嵌入向量包括:以经训练得到的权重作为各个项目嵌入向量的权重,对生成的多个所述项目嵌入向量进行加权平均以得到所述项目组的综合嵌入向量。


8.根据权利要求1所述的方法,其中使用得到的所述综合嵌入向量、所述用户的用户嵌入向量和所述与所述项目组相对应的标签来训练所述推荐模型包括:
对所述综合嵌入向量和所述用户的用户嵌入向量进行点积运算得到点积结果;
基于所述点积结果与所述项目组相对应的标签计算损失函数;以及
对所述推荐模型中的参数进行调整以使所述损失函数收敛。


9.根据权利要求8所述的方法,其中基于所述点积结果与所述项目组相对应的标签计算损失函数包括:
对所述点积结果进行归一化,和基于经归一化的点积结果与所述项目组相对应的标签计算损失函数。


10.根据权利要求1-9中任一项所述的方法,其中所述项目包括商品、电影和文章。


11.一种用于向用户推荐项目的方法,包括:
获取目标用户的目标...

【专利技术属性】
技术研发人员:潘颖吉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1