推荐模型训练方法、推荐方法、设备及存储介质技术

技术编号：35490825 阅读：26 留言：0更新日期：2022-11-05 16:46

本发明专利技术提供了一种推荐模型训练方法、推荐方法、设备及存储介质，该方法包括：获取第一推荐模型和深度交叉场景特征网络单元；基于所述第一推荐模型和所述深度交叉场景特征网络单元构建第二推荐模型，所述深度交叉场景特征网络单元配置为将非场景特征和场景特征进行交叉组合；采集第一样本数据集，所述第一样本数据集中每个样本的数据包括场景特征、非场景特征和所对应的推荐结果标签；以及基于所述第一样本数据集训练所述第二推荐模型。本发明专利技术开发了深度交叉场景特征的深度网络单元，可以灵活嵌入到推荐系统的召回和/或排序深度模型中，达到共享多场景数据和更好地匹配各场景数据分布的目的。分布的目的。分布的目的。

全部详细技术资料下载

【技术实现步骤摘要】
推荐模型训练方法、推荐方法、设备及存储介质

[0001]本专利技术涉及数据处理
，尤其涉及一种推荐模型训练方法、推荐方法、设备及存储介质。

技术介绍

[0002]推荐系统被广泛应用于各大APP，用来增强用户的个性化体验的同时增加供应商收入。召回和排序算法作为推荐系统的两大重要模块，直接影响了最终的推荐结果和收益。
[0003]推荐系统的算法完全依赖用户行为数据，数据是效果的上限，而模型只是尽可能逼近上限。但是，推荐系统一直存在数据稀疏的问题，针对同样的推荐候选集，各个场景的数据分布并不是完全一致，导致各个场景用于模型的数据各自为营，数据更加稀疏。举例说明：在线旅行社APP中有多个场景的景点相关数据，比如酒店订后景点推荐，列表页景点排序等。特点就是使用同样的景点候选集，但是各自场景的用户行为数据分布完全不一样。酒店订后景点推荐场景下用户可能会关注酒店相关的信息，可能就是为了某些景点而定的酒店，同时因为是酒店订单后的场景，数据相对会稀疏一点；而列表页景点排序的用户则更多可能关注当前城市内的景点，甚至只是想找一些日常朋友聚会的景点，如KTV、桌游吧等，同时该场景数据相对会多一些。一般情况下，有三种常规的解决方案：1)根据各个场景的数据分别建模，得到多个模型分别用于线上推理。但是这种方法有明显缺点，一是多个模型浪费资源且不易维护，二是各个场景数据稀疏，导致模型欠拟合，效果不好；2)为了解决方案1的缺点，将多个场景的数据混合到一起建模，最终针对同样的候选集使用一个模型线上推理。这种方案的缺点是合并多个场景的训练数...

【技术保护点】

【技术特征摘要】
1.一种推荐模型训练方法，其特征在于，包括如下步骤：获取第一推荐模型和深度交叉场景特征网络单元；基于所述第一推荐模型和所述深度交叉场景特征网络单元构建第二推荐模型，所述深度交叉场景特征网络单元配置为将非场景特征和场景特征进行交叉组合；采集第一样本数据集，所述第一样本数据集中每个样本的数据包括场景特征、非场景特征和所对应的推荐结果标签；基于所述第一样本数据集训练所述第二推荐模型。2.根据权利要求1所述的推荐模型训练方法，其特征在于，所述第二推荐模型配置为将场景特征和非场景特征进行拼接得到第一特征，将所述场景特征和非场景特征输入所述深度交叉场景特征网络单元得到第二特征，并将所述第一特征和所述第二特征输入所述第一推荐模型，将所述第一推荐模型的输出结果作为预测推荐结果。3.根据权利要求1所述的推荐模型训练方法，其特征在于，所述第一推荐模型为第一召回模型，所述第二推荐模型为第二召回模型；或，所述第一推荐模型为第一排序模型，所述第二推荐模型为第二排序模型。4.根据权利要求1所述的推荐模型训练方法，其特征在于，所述深度交叉场景特征网络单元包括场景特征侧和非场景特征侧，所述非场景特征侧中各个处理层之间的权重矩阵和偏置项由所述场景特征侧输入。5.根据权利要求4所述的推荐模型训练方法，其特征在于，所述深度交叉场景特征网络单元的场景特征侧包括第一处理层，输入的场景特征经过Embedding和全连接处理得到第一向量，所述第一处理层将所述第一向量拆分得到第一权重矩阵、第一偏置项、第二权重矩阵和第二偏置项；所述非场景特征侧包括第二处理层、第三处理层和第四处理层，所述第一权重矩阵和所述第一偏置项输入所述第二处理层和所述第三处理层之间，所述第二权重矩阵和所述第二偏置项输入所述第三处理层和所述第四处理层之间。6.根据权利要求1所述的推荐模型训练方法，其特征在于，所述第一推荐模型为第一召回模型，所述第二推荐模型为第二召回模型；基于所述样本数据集训练所述第二推荐模型后，还包括如下步骤：获取第三推荐模型，所述第三推荐模型为第三排序模型；基于所述第三推荐模型和所述深度交叉场景特征网络单元构建第四推荐模型，所述第四推荐模型为第四排序模型；采集第二样本数据集，所述第二样本数据集中每个样本的数据包括场景特征、非场景特征和所对应的推荐结...

【专利技术属性】
技术研发人员：郭伟，刘典智，王荣生，程婉玉，李健，
申请(专利权)人：携程旅游信息技术上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人