目标推荐方法及装置制造方法及图纸

技术编号:38270042 阅读:13 留言:0更新日期:2023-07-27 10:25
本公开涉及计算机技术领域,提供了一种目标推荐方法及装置。该方法包括:获取当前用户行为序列的当前用户行为序列图,所述当前用户行为序列为描述当前用户对商品进行访问的时序的序列;将所述当前用户行为序列图输入到预置的图向量提取模型,得到所述当前用户行为序列图的各节点表征向量;将所述各节点表征向量输入预置的目标推荐模型,得到所述目标推荐模型输出的目标商品,其中,所述目标推荐模型采用判断用户行为序列图是否相近的对比学习损失函数和判断用户是否选择商品的二分类损失函数训练得到。函数训练得到。函数训练得到。

【技术实现步骤摘要】
目标推荐方法及装置


[0001]本公开涉及计算机
,尤其涉及一种目标推荐方法及装置。

技术介绍

[0002]在线上电子商务等业务场景中,如何根据用户的个性化特征为用户推荐合适的商品或服务一直是一个重要课题。
[0003]在某些相对低频场景下,如线上广告,线上租房,买房等场景下,由于点击商品或者服务并购买的正样本数据的稀疏性,当前主流的推荐模型不能很好的捕捉用户和商品的关系,很难对用户接下来的行为进行很精准的预测,会出现过拟合,泛化能力弱等问题,在提高用户转化率上有一定的局限性。
[0004]如何提高稀疏场景下序列推荐模型的泛化能力是当前亟需解决的技术问题。

技术实现思路

[0005]有鉴于此,本公开实施例提供了一种目标推荐方法、装置、电子设备及计算机可读存储介质,以解决现有技术中稀疏场景下序列推荐模型泛化能力较差的问题。
[0006]本公开实施例的第一方面,提供了一种目标推荐方法,该方法包括:获取当前用户行为序列的当前用户行为序列图,所述当前用户行为序列为描述当前用户对商品进行访问的时序的序列;将所述当前用户行为序列图输入到预置的图向量提取模型,得到所述当前用户行为序列图的各节点表征向量;将所述各节点表征向量输入预置的目标推荐模型,得到所述目标推荐模型输出的目标商品,其中,所述目标推荐模型采用判断用户行为序列图是否相近的对比学习损失函数和判断用户是否选择商品的二分类损失函数训练得到。
[0007]本公开实施例的第二方面,提供了一种目标推荐装置,该装置包括:序列获取模块,用于获取当前用户行为序列的当前用户行为序列图,所述当前用户行为序列为描述当前用户对商品进行访问的时序的序列;序列图获取模块,用于将所述当前用户行为序列图输入到预置的图向量提取模型,得到所述当前用户行为序列图的各节点表征向量;目标推荐模块,用于将所述各节点表征向量输入预置的目标推荐模型,得到所述目标推荐模型输出的目标商品,其中,所述目标推荐模型采用判断用户行为序列图是否相近的对比学习损失函数和判断用户是否选择商品的二分类损失函数训练得到。
[0008]本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
[0009]本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
[0010]本公开实施例与现有技术相比存在的有益效果是:通过构建用户行为序列图的图结构,并在目标推荐模型的训练过程中引入了对比学习的方法,进一步增强图结构表征能力,提升了整个目标推荐模型的泛化能力,从而在用户行为稀疏场景中能够跨用户挖掘不
同图之间的潜在关联,提升了目标推荐模型在垂直场景中的推荐泛化性能。
附图说明
[0011]为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0012]图1是现有技术中的一种的人工神经网络框架的示意图;
[0013]图2是本公开实施例提供的一种目标推荐方法的流程示意图;
[0014]图3是本公开实施例提供的一种序列转化的示意图;
[0015]图4是本公开实施例提供的一种目标推荐模型的训练过程的流程示意图;
[0016]图5是本公开实施例提供的一种目标推荐网络框架的示意图;
[0017]图6是本公开实施例提供的一种目标推荐装置的结构示意图;
[0018]图7是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
[0019]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本公开实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本公开的描述。
[0020]在线上电子商务场景中,用户常常在同一个电子商务网站或移动端应用程序中浏览多个商品或服务,其行为可能有在某商品页面停留,点击商品查看详情等操作,这些操作可以称为与商品的交互行为。在一段时间内同一个用户在某电子商务网站或应用程序中存在交互行为的商品产生的交互行为的特征,按照时间先后顺序排列后可以构成一个关于该用户的交互商品序列。该用户在与最后一个商品交互后的一段时间内是否对交互商品产生了订购或预约等进一步的行为,可以称为是否转化。
[0021]在训练序列推荐模型时,需要针对用户的交互商品的序列进行转化行为收集,获得用户最终是否在某些商品上进行转化的数据。序列推荐模型的训练目标就是在以用户的交互商品序列为输入的情况下,进行用户会在哪些商品上产生实际的转化行为的判断。这类序列推荐模型可在使用过程中将高转化可能性的商品优先推送给客户,从而提高用户的转化率。
[0022]相关技术中,在线上电子商务推荐场景中,主要采用基于用户行为作为反馈信息,根据用户的喜好进行序列推荐模型的建模,然后根据用户喜好与已有商品库内的商品或服务的匹配关系排序,推荐最符合用户喜好的商品或服务。该类序列推荐模型的整体结构都是输入给模型一批用户特征和商品特征,对某一个特定商品进行判别用户是否会点击以及是否购买该商品。该判别结果作为模型的输出结果,可以与真实的用户点击和购买结果相结合进行损失函数计算,从而指导序列推荐模型进行优化。比较有代表性的序列推荐模型有DeepFM(Deep Factorization Machine,深度因式分解机)和DIN(Deep Interest Network,深度兴趣网络)等。
[0023]如图1所示的是一种人工神经网络模型的架构图。该人工神经网络模型可以为深度兴趣网络模型,该模型输入主要分为三个部分:用户性别、年龄等用户内部特征U0、U1、U2、U3、U4、U5,用户过去对商品产生点击或者购买行为等用户商品交互特征I0、I1、I2、I3、I4、I5,某待预测的商品的商品内部特征P0、P1、P2、P3、P4、P5。
[0024]如图1所示,将以上三个部分输入到人工神经网络模型中后,该人工神经网络模型会重点建模历史行为序列与目标商品之间的关系,通过过去的历史判断用户对当前该商品的喜好程度,最后输出一个单独的概率判断用户点击或者购买的倾向。
[0025]该深度兴趣网络模型的共同点是使用已知特征对某用户以及单一的某个特定商品进行预测。此类基于单个用户和商品在被点击或者购买商品产生的正样本,相对于基于单个用户和商品在未被点击或者购买商品对应的负样本的比例很小时,会对模型训练造成较大不良影响,从而导致模型精度下降和正样本的召回率下降。这种情况下,该深度兴趣网络模型需要对正样本进行过采样本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标推荐方法,其特征在于,所述方法包括:获取当前用户行为序列的当前用户行为序列图,所述当前用户行为序列为描述当前用户对商品进行访问的时序的序列;将所述当前用户行为序列图输入到预置的图向量提取模型,得到所述当前用户行为序列图的各节点表征向量;将所述各节点表征向量输入预置的目标推荐模型,得到所述目标推荐模型输出的目标商品,其中,所述目标推荐模型采用判断用户行为序列图是否相近的对比学习损失函数和判断用户是否选择商品的二分类损失函数训练得到。2.根据权利要求1所述的方法,其特征在于,所述目标推荐模型的训练方法包括:获取第一历史用户行为序列图对和第二历史用户行为序列图对,其中,所述第一历史用户行为序列图对中的序列图为商品相似但购买行为不同的序列的历史用户行为序列图,所述第二历史用户行为序列图对中的序列图为商品不相似但购买行为相同的所述历史用户行为序列图,其中,所述历史用户行为序列图是历史用户行为序列集中的历史用户行为序列的序列图;根据所述第一历史用户行为序列图对中的序列图的图表征向量间的第一平均距离和所述第二历史用户行为序列图对中的序列图的图表征向量间的第二平均距离获取对比学习损失函数值;根据所述历史用户行为序列对应的训练标签和根据初始推荐模型和所述历史用户行为序列对应的历史用户行为序列图的各节点表征向量进行预测得到的用户交互结果获取二分类损失函数值;根据所述对比学习损失函数值和所述二分类损失函数值调整所述初始推荐模型,直到所述初始推荐模型收敛,得到所述目标推荐模型。3.根据权利要求2所述的方法,其特征在于,根据所述第一历史用户行为序列图对中的序列图的图表征向量间的第一平均距离和所述第二历史用户行为序列图对中的序列图的图表征向量间的第二平均距离获取对比学习损失函数值,包括:对所述第一历史用户行为序列图对中的序列图的图表征向量进行采样,计算采样数据向量差的距离数据并求取平均值,得到第一平均距离;对所述第二历史用户行为序列图对中的序列图的图表征向量进行采样,计算采样数据向量差的距离数据并求取平均值,得到第二平均距离;根据所述第二平均距...

【专利技术属性】
技术研发人员:暴宇健董辉
申请(专利权)人:北京龙智数科科技服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1