【技术实现步骤摘要】
推荐模型的训练方法、装置、设备、介质及程序产品
[0001]本申请涉及人工智能领域,特别涉及一种推荐模型的训练方法
、
装置
、
设备
、
介质及程序产品
。
技术介绍
[0002]在游戏中通常提供有虚拟商城,在虚拟商城内玩家可以通过虚拟资源兑换虚拟物品,例如,虚拟道具
、
虚拟角色
、
虚拟皮肤等
。
虚拟商城在对待兑换的虚拟物品进行展示时,会融入推荐系统,推荐系统根据账号的偏好对账号对于虚拟物品的兴趣度进行预测,并根据预测结果进行虚拟物品的展示和推荐
。
[0003]相关技术中,上述推荐系统中的推荐预测模型的训练通常采用数据窗口训练模式,即,根据设置的数据窗口获取账号的历史行为数据,将上述历史行为数据作为样本数据训练初始化的模型,从而得到需求的推荐模型
。
例如,当数据窗口为一个月时,当需要对推荐模型进行更新时,获取上一个月内的历史行为数据以用于模型训练
。
[0004] ...
【技术保护点】
【技术特征摘要】
1.
一种推荐模型的训练方法,其特征在于,所述方法包括:获取目标账号在第一历史时间段内生成的多个交互数据组,所述交互数据组中包括多个交互数据,所述交互数据用于表示所述目标账号与虚拟物品之间的交互关系;对所述交互数据组中的多个交互数据进行特征交叉处理,得到所述交互数据组的交叉特征表示;通过候选物品推荐模型对所述交叉特征表示进行兴趣度预测,得到所述目标账号与所述虚拟物品之间的兴趣度预测结果,所述候选物品推荐模型是基于所述目标账号在第二历史时间段内生成的多个交互数据组训练得到的模型,所述第二历史时间段的终止时刻在时序上位于所述第一历史时间段的终止时刻之前;基于所述兴趣度预测结果对所述候选物品推荐模型进行训练,得到物品推荐模型,所述物品推荐模型用于在游戏商城中对所述目标账号进行虚拟物品推荐
。2.
根据权利要求1所述的方法,其特征在于,所述对所述交互数据组中的多个交互数据进行特征交叉处理,得到所述交互数据组的交叉特征表示,包括:对所述交互数据组中的多个交互数据分别进行特征提取,得到每个交互数据对应的数据特征表示;基于所述多个交互数据的数据特征表示之间的笛卡尔积,确定所述交叉特征表示
。3.
根据权利要求2所述的方法,其特征在于,所述基于所述多个交互数据的数据特征表示之间的笛卡尔积,确定所述交叉特征表示,包括:获取所述交互数据组中前
i
个交互数据对应的第一候选特征表示,所述第一候选特征表示为所述前
i
个交互数据对应的连续笛卡尔积;将第
i+1
个交互数据对应的数据特征表示和所述第一候选特征表示作笛卡尔积,得到所述交叉特征表示,
i
为正整数;或者,将所述交互数据组中第
i
个交互数据的数据特征表示和第
j
个交互数据的数据特征表示作笛卡尔积,得到第二候选特征表示,
i
和
j
为不相等的正整数;将所述交互数据组中每两个交互数据之间的第二候选特征表示进行特征连接,得到所述交叉特征表示
。4.
根据权利要求2所述的方法,其特征在于,所述虚拟物品包括第一类物品和第二类物品,所述第一类物品是待推荐的物品,所述第二类物品是与所述第一类物品存在依存关系的虚拟物品,所述交互数据组中包括与所述第一类物品对应的第一交互数据和所述第二类物品对应的第二交互数据中的至少一种;所述基于所述多个交互数据的数据特征表示之间的笛卡尔积,确定所述交叉特征表示,包括:获取所述目标账号在所述第一历史时间段内的顺序偏好信息,所述顺序偏好信息指示所述目标账号对具有所述依存关系的所述第一类物品和所述第二类物品进行获取时的顺序偏好;基于所述顺序偏好信息确定所述第一交互数据和所述第二交互数据分别对应的权重;根据所述权重对所述多个交互数据的数据特征表示进行加权笛卡尔积处理,得到所述交叉特征表示
。5.
根据权利要求1至4任一所述的方法,其特征在于,所述通过候选物品推荐模型对所述交叉特征表示进行兴趣度预测,得到所述目标账号与虚拟物品之间的兴趣度预测结果之
前,还包括:获取所述第二历史时间段对应的历史模型参数;将所述历史模型参数装载至待训练模型上,得到所述候选物品推荐模型
。6.
根据权利要求1至4任一所述的方法,其特征在于,所述物品推荐模型用于在指定时间段内对所述目标账号进行物品推荐,所述指定时间段的起始时刻在时序上位于所述第一历史时间段的终止时刻之后,所述方法还包括:在所述指定时间段内接收针对所述目标账号的物品推荐请求,所述物品推荐请求中包括所述目标账号对应的账号信息;获取候选物品对应的物品信息;将所述账号信息和所述物品信息输入至所述物品推荐模型进行预测,得到所述候选物品对应的推荐得分;基于所述候选物品的所述推荐得分向所述目标账号进行物品推荐
。7.
根据权利要求6所述的方法,其特征在于,所述基于所述兴趣度预测结果对所述候选物品推荐模型进行训练,得到物品推荐模型之后,还包括:将所述物品推荐模型的模型参数更新至线上参数存储区,所述线上参数存储区用于为实时物品推荐的预测提供模型参数
。8.
根据权利要求7所述的方法,其特征在于,所述将所述账号信息和所述物品信息输入至所述物...
【专利技术属性】
技术研发人员:曾纪川,陈翔宇,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。