推荐模型训练方法、推荐方法、设备及存储介质技术

技术编号:35490825 阅读:26 留言:0更新日期:2022-11-05 16:46
本发明专利技术提供了一种推荐模型训练方法、推荐方法、设备及存储介质,该方法包括:获取第一推荐模型和深度交叉场景特征网络单元;基于所述第一推荐模型和所述深度交叉场景特征网络单元构建第二推荐模型,所述深度交叉场景特征网络单元配置为将非场景特征和场景特征进行交叉组合;采集第一样本数据集,所述第一样本数据集中每个样本的数据包括场景特征、非场景特征和所对应的推荐结果标签;以及基于所述第一样本数据集训练所述第二推荐模型。本发明专利技术开发了深度交叉场景特征的深度网络单元,可以灵活嵌入到推荐系统的召回和/或排序深度模型中,达到共享多场景数据和更好地匹配各场景数据分布的目的。分布的目的。分布的目的。

【技术实现步骤摘要】
推荐模型训练方法、推荐方法、设备及存储介质


[0001]本专利技术涉及数据处理
,尤其涉及一种推荐模型训练方法、推荐方法、设备及存储介质。

技术介绍

[0002]推荐系统被广泛应用于各大APP,用来增强用户的个性化体验的同时增加供应商收入。召回和排序算法作为推荐系统的两大重要模块,直接影响了最终的推荐结果和收益。
[0003]推荐系统的算法完全依赖用户行为数据,数据是效果的上限,而模型只是尽可能逼近上限。但是,推荐系统一直存在数据稀疏的问题,针对同样的推荐候选集,各个场景的数据分布并不是完全一致,导致各个场景用于模型的数据各自为营,数据更加稀疏。举例说明:在线旅行社APP中有多个场景的景点相关数据,比如酒店订后景点推荐,列表页景点排序等。特点就是使用同样的景点候选集,但是各自场景的用户行为数据分布完全不一样。酒店订后景点推荐场景下用户可能会关注酒店相关的信息,可能就是为了某些景点而定的酒店,同时因为是酒店订单后的场景,数据相对会稀疏一点;而列表页景点排序的用户则更多可能关注当前城市内的景点,甚至只是想找一些日常朋友聚会的景点,如KTV、桌游吧等,同时该场景数据相对会多一些。一般情况下,有三种常规的解决方案:1)根据各个场景的数据分别建模,得到多个模型分别用于线上推理。但是这种方法有明显缺点,一是多个模型浪费资源且不易维护,二是各个场景数据稀疏,导致模型欠拟合,效果不好;2)为了解决方案1的缺点,将多个场景的数据混合到一起建模,最终针对同样的候选集使用一个模型线上推理。这种方案的缺点是合并多个场景的训练数据完全破坏了各个场景的数据分布,模型往往容易向数据较多场景的数据分布去学习,导致最终的效果各个场景不一;3)该方案目的是改进方案2的缺点,在建模时候简单加入场景的特征,让模型自己学习达到区分各个场景数据分布的目的。但是深度模型并不是万能的,简单给定场景特征,很难找到数据共享和自适应各场景数据分布的平衡点,实际落地效果并不明显。
[0004]需要说明的是,上述
技术介绍
部分公开的信息仅用于加强对本专利技术的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]针对现有技术中的问题,本专利技术的目的在于提供一种推荐模型训练方法、推荐方法、设备及存储介质,针对同样的推荐候选集在不同的场景都有各自的用户行为分布,合并多场景数据建模导致线上各场景效果不一的问题,开发了深度交叉场景特征的深度网络单元,可以灵活嵌入到推荐系统的召回和/或排序深度模型中,达到共享多场景数据和更好地匹配各场景数据分布的目的。
[0006]本专利技术实施例提供一种推荐模型训练方法,包括如下步骤:
[0007]获取第一推荐模型和深度交叉场景特征网络单元;
[0008]基于所述第一推荐模型和所述深度交叉场景特征网络单元构建第二推荐模型,所
述深度交叉场景特征网络单元配置为将非场景特征和场景特征进行交叉组合;
[0009]采集第一样本数据集,所述第一样本数据集中每个样本的数据包括场景特征、非场景特征和所对应的推荐结果标签;
[0010]基于所述第一样本数据集训练所述第二推荐模型。
[0011]在一些实施例中,所述第二推荐模型配置为将场景特征和非场景特征进行拼接得到第一特征,将所述场景特征和非场景特征输入所述深度交叉场景特征网络单元得到第二特征,并将所述第一特征和所述第二特征输入所述第一推荐模型,将所述第一推荐模型的输出结果作为预测推荐结果。
[0012]在一些实施例中,所述第一推荐模型为第一召回模型,所述第二推荐模型为第二召回模型;或,
[0013]所述第一推荐模型为第一排序模型,所述第二推荐模型为第二排序模型。
[0014]在一些实施例中,所述深度交叉场景特征网络单元包括场景特征侧和非场景特征侧,所述非场景特征侧中各个处理层之间的权重矩阵和偏置项由所述场景特征侧输入。
[0015]在一些实施例中,所述深度交叉场景特征网络单元的场景特征侧包括第一处理层,输入的场景特征经过Embedding和全连接处理得到第一向量,所述第一处理层将所述第一向量拆分得到第一权重矩阵、第一偏置项、第二权重矩阵和第二偏置项;
[0016]所述非场景特征侧包括第二处理层、第三处理层和第四处理层,所述第一权重矩阵和所述第一偏置项输入所述第二处理层和所述第三处理层之间,所述第二权重矩阵和所述第二偏置项输入所述第三处理层和所述第四处理层之间。
[0017]在一些实施例中,所述第一推荐模型为第一召回模型,所述第二推荐模型为第二召回模型;
[0018]基于所述样本数据集训练所述第二推荐模型后,还包括如下步骤:
[0019]获取第三推荐模型,所述第三推荐模型为第三排序模型;
[0020]基于所述第三推荐模型和所述深度交叉场景特征网络单元构建第四推荐模型,所述第四推荐模型为第四排序模型;
[0021]采集第二样本数据集,所述第二样本数据集中每个样本的数据包括场景特征、非场景特征和所对应的推荐结果标签;
[0022]基于所述第二样本数据集训练所述第四推荐模型。
[0023]在一些实施例中,所述非场景特征包括用户特征、物品特征和上下文特征中的至少一种,所述第二推荐模型的预测推荐结果包括是否召回的概率,所述第四推荐模型的预测推荐结果包括用户的点击概率。
[0024]在一些实施例中,所述第四推荐模型配置为将场景特征和非场景特征进行拼接得到第三特征,将所述场景特征和非场景特征输入所述深度交叉场景特征网络单元得到第四特征,并将所述第三特征和所述第四特征输入所述第三推荐模型,将所述第三推荐模型的输出结果作为预测推荐结果。
[0025]本专利技术实施例还提供一种推荐方法,采用所述的第二推荐模型和第四推荐模型,所述推荐方法包括如下步骤:
[0026]接收到用户的查看物品请求;
[0027]获取场景特征、用户特征和上下文特征,将所述用户特征、所述上下文特征和候选
物品特征组合得到第一非场景特征;
[0028]将所述场景特征和所述第一非场景特征输入所述第二推荐模型;
[0029]根据所述第二推荐模型的输出确定召回物品列表;
[0030]将所述用户特征、所述上下文特征和召回物品特征组合得到第二非场景特征;
[0031]将所述场景特征和所述第二非场景特征输入所述第四推荐模型;
[0032]根据所述第四推荐模型的输出确定召回物品排序。
[0033]本专利技术实施例还提供一种推荐系统,用于实现所述的推荐模型训练方法,所述系统包括:
[0034]请求接收模块,用于接收到用户的查看物品请求;
[0035]物品召回模块,用于获取场景特征、用户特征和上下文特征,将所述用户特征、所述上下文特征和候选物品特征组合得到第一非场景特征,将所述场景特征和所述第一非场景特征输入所述第二推荐模型,以及根据所述第二推荐模型的输出确定召回物品列表;
[0036]物品排序模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种推荐模型训练方法,其特征在于,包括如下步骤:获取第一推荐模型和深度交叉场景特征网络单元;基于所述第一推荐模型和所述深度交叉场景特征网络单元构建第二推荐模型,所述深度交叉场景特征网络单元配置为将非场景特征和场景特征进行交叉组合;采集第一样本数据集,所述第一样本数据集中每个样本的数据包括场景特征、非场景特征和所对应的推荐结果标签;基于所述第一样本数据集训练所述第二推荐模型。2.根据权利要求1所述的推荐模型训练方法,其特征在于,所述第二推荐模型配置为将场景特征和非场景特征进行拼接得到第一特征,将所述场景特征和非场景特征输入所述深度交叉场景特征网络单元得到第二特征,并将所述第一特征和所述第二特征输入所述第一推荐模型,将所述第一推荐模型的输出结果作为预测推荐结果。3.根据权利要求1所述的推荐模型训练方法,其特征在于,所述第一推荐模型为第一召回模型,所述第二推荐模型为第二召回模型;或,所述第一推荐模型为第一排序模型,所述第二推荐模型为第二排序模型。4.根据权利要求1所述的推荐模型训练方法,其特征在于,所述深度交叉场景特征网络单元包括场景特征侧和非场景特征侧,所述非场景特征侧中各个处理层之间的权重矩阵和偏置项由所述场景特征侧输入。5.根据权利要求4所述的推荐模型训练方法,其特征在于,所述深度交叉场景特征网络单元的场景特征侧包括第一处理层,输入的场景特征经过Embedding和全连接处理得到第一向量,所述第一处理层将所述第一向量拆分得到第一权重矩阵、第一偏置项、第二权重矩阵和第二偏置项;所述非场景特征侧包括第二处理层、第三处理层和第四处理层,所述第一权重矩阵和所述第一偏置项输入所述第二处理层和所述第三处理层之间,所述第二权重矩阵和所述第二偏置项输入所述第三处理层和所述第四处理层之间。6.根据权利要求1所述的推荐模型训练方法,其特征在于,所述第一推荐模型为第一召回模型,所述第二推荐模型为第二召回模型;基于所述样本数据集训练所述第二推荐模型后,还包括如下步骤:获取第三推荐模型,所述第三推荐模型为第三排序模型;基于所述第三推荐模型和所述深度交叉场景特征网络单元构建第四推荐模型,所述第四推荐模型为第四排序模型;采集第二样本数据集,所述第二样本数据集中每个样本的数据包括场景特征、非场景特征和所对应的推荐结...

【专利技术属性】
技术研发人员:郭伟刘典智王荣生程婉玉李健
申请(专利权)人:携程旅游信息技术上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1