【技术实现步骤摘要】
礼包生成模型训练方法、礼包推送方法、装置及电子设备
[0001]本申请涉及计算机
,具体涉及一种礼包生成模型训练方法、礼包推送方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]在网络游戏中,游戏开发商为了增强玩家游戏过程中的游戏体验,通常会给玩家推送一些礼包。游戏礼包通常是指由多个商品以任意数量组成的商品组合,玩家购买礼包后,礼包中的所有商品同时被玩家购买。
[0003]相关技术在为玩家推送礼包时,通常是由具有先验知识的游戏设计人员先设计出一批热门礼包,将设计出的热门礼包作为礼包池,再基于玩家的历史浏览与购买记录、玩家的属性信息等从礼包池中选择出与玩家偏好最符合的礼包并推送给玩家。
[0004]然而,上述礼包推送方式由于只能在固定的礼包池中选择礼包推送给玩家,而礼包池中的礼包组合形式是有限的,容易导致推送给玩家的礼包中的商品并不是玩家喜欢的,从而导致玩家可能买到自己不喜欢的礼包,降低了玩家的游戏满意度和玩家体验,从而降低了玩家留存率。
技术实现思路
[0005]本申请提供 ...
【技术保护点】
【技术特征摘要】
1.一种礼包生成模型训练方法,其特征在于,所述训练方法包括:获取训练集,所述训练集包括各样本用户分别对应的样本用户画像信息;根据所述样本用户画像信息以及第0~i
‑
1个输出商品信息确定待训练礼包生成模型的第一输入信息,并将所述第一输入信息输入所述待训练礼包生成模型中,得到为所述样本用户生成的样本礼包中的第i个输出商品信息,i为整数,i遍历1~N,N为样本礼包中包含的预设商品种类数,第0个输出商品信息为空;根据第1~N个所述输出商品信息为所述样本用户生成样本礼包;确定样本用户购买所述样本礼包的意向参数;以提升所述意向参数为参数调整原则,调整所述待训练礼包生成模型的模型参数,直至所述意向参数满足预设条件,得到训练好的礼包生成模型。2.根据权利要求1所述的训练方法,其特征在于,所述根据所述样本用户画像信息以及第0~i
‑
1个输出商品信息确定待训练礼包生成模型的第一输入信息,包括:对所述样本用户画像信息以及第0~i
‑
1个输出商品信息进行数值化编码,得到第一数值特征,并将所述第一数值特征确定为待训练礼包生成模型的第一输入信息;所述将所述第一输入信息输入所述待训练礼包生成模型中,得到为所述样本用户生成的样本礼包中的第i个输出商品信息,包括:将所述第一输入信息输入所述待训练礼包生成模型中,得到为所述样本用户生成的样本礼包中第i个输出商品的数值表征信息;根据所述第i个输出商品的数值表征信息确定为所述样本用户生成的样本礼包中的第i个输出商品信息。3.根据权利要求2所述的训练方法,其特征在于,所述根据所述第i个输出商品的数值表征信息确定为所述样本用户生成的样本礼包中的第i个输出商品信息,包括:从预存的各样本候选商品中选择样本目标商品作为为所述样本用户生成的样本礼包中的第i个输出商品信息,其中,所述样本目标商品对应的数值表征信息与所述第i个输出商品信息的数值表征信息的相似度大于第一预设相似度,所述样本候选商品设置有对应的数值表征信息。4.根据权利要求2所述的训练方法,其特征在于,在所述根据第1~N个所述输出商品信息为所述样本用户生成样本礼包之前,所述训练方法还包括:根据所述样本用户画像信息、第1~i个所述输出商品信息以及第0~i
‑
1个输出商品的商品数量,确定所述待训练礼包生成模型的第二输入信息,并将所述第二输入信息输入所述待训练礼包生成模型中,得到第i个输出商品的商品数量;当i大于1时,所述根据所述样本用户画像信息以及第0~i
‑
1个输出商品信息确定所述待训练礼包生成模型的第一输入信息,包括:根据所述样本用户画像信息、第0~i
‑
1个输出商品信息以及第0~i
‑
1个输出商品的商品数量,确定所述待训练礼包生成模型的第一输入信息;所述根据第1~N个所述输出商品信息为所述样本用户生成样本礼包,包括:根据第1~N个所述输出商品信息、第1~N个输出商品的商品数量为所述样本用户生成样本礼包。5.根据权利要求4所述的训练方法,其特征在于,所述根据所述样本用户画像信息、第1
~i个所述输出商品信息以及第0~i
‑
1个输出商品的商品数量,确定所述待训练礼包生成模型的第二输入信息,包括:对所述样本用户画像信息、第1~i个所述输出商品信息以及第0~i
‑
1个输出商品的商品数量进行数值化编码,得到第二数值特征,并将所述第二数值特征确定为所述待训练礼包生成模型的第二输入信息;所述将所述第二输入信息输入所述待训练礼包生成模型中,得到第i个输出商品的商品数量,包括:将所述第二输入信息输入所述待训练礼包生成模型中,得到用于表征第i个输出商品的商品数量的数值表征信息;根据所述第i个输出商品的商品数量的数值表征信息确定第i个输出商品的商品数量。6.根据权利要求2所述的训练方法,其特征在于,所述对所述样本用户画像信息以及第0~i
‑
1个输出商品信息进行数值化编码,得到第一数值特征,包括:将所述样本用户画像信息以及第0~i
‑
1个输出商品信息输入第一编码模型中进行数值化编码,得到第一数值特征。7.根据权利要求6所述的训练方法,其特征在于,所述训练方法还包括:以提升所述意向参数为参数调整原则,调整所述第一编码模型中的模型参数,直至所述意向参数满足所述预设条件,得到优化训练后第一编码模型。8.根据权利要求1所述的训练方法,其特征在于,所述确定样本用户购买所述样本礼包的意向参数,包括:将所述样本用户画像信息与所述样本礼包输入训练好的概率计算模型中,得到样本用户购买所述样本礼包的概率。9.根据权利要求1至8任一项所述的训练方法,其特征在于,所述样本用户画像信息包括以下至少一种:样本用户历史购买物品信息、样本用户的属性描述信息;所述样本用户历史购买物品信息包括以下至少一种:样本用户历史购买礼包信息、样本用户历史购买商品信息,其中,礼包中包括至少一个商品。10.根据权利要求9所述的训练方法,其特征在于,在所述样本用户历史购买物品信息包括样本用户历史购买礼包信息以及样本用户历史购买商品信息的情况下,所述样本用户历史购买物品信息具体包括:样本用户的历史购买礼包中包括的各商品以及样本用户的历史购买商品按照购买时间进行排序后的样本商品序列。11.根据权利要求10所述的训练方法,其特征在于,所述样本用户历史购买物品信息还包括:样本用户的历史购买礼包按购买时间进行排序后的样本礼包序列。12.根据权利要求9所述的训练方法,其特征在于,所述样本用户的属性描述信息包括以下至少一种:样本用户等级、样本用户的游戏平均消费金额、样本用户装备数值、样本用户在线时长信息、样本用户的性别信息、样本用户的年龄信息、样本用户所处地理位置。13.根据权利要求1至8任一项所述的训练方法,其特征在于,所述训练方法还包括:当到达预设时机时,获取所述各样本用户对应的最新样本用户画像信息,所述最新样本用户画像信息的生成时间距离当前时间小于预设时间间隔;使用所述最新样本用户画像信息对所述训练好的礼包生成模型进行更新训练,得到更新后的礼包生成模型。
14.一种礼包推送方法,其特征在于,所述推送方法包括:获取待推送用户的待推送用户画像信息;根据所述待推送用户画像信息以及第0~j
‑
1个待推送商品信息确定训练好的礼包生成模型的第三输入信息,并将所述第三输入信息输入所述训练好的礼包生成模型中,得到为所述待推送用户生成的推送礼包中的第j个待推送商品信息,j为整数,j遍历1~T,T为推送礼包中包含的预设商品种类数,第0个待推送商品信息为空,所述训练好的礼包生成模型通过权利要求1至13中任一项所述的礼包生成模型训练方法训练而成;根据第1~T个所述待推送商品信息为所述待推送用户生成推送礼包;将所述推送礼包推送给所述待推送用户。15.根据权利要求14所述的推送方法,其特征在于,所述将所述待推送用户画像信息以及第0~j
‑
1个待推送商品信息确定训练好的礼包生成模型...
【专利技术属性】
技术研发人员:王凯,赵明浩,邹哲讷,阮翊婷,吴润泽,沈旭东,吕唐杰,范长杰,胡志鹏,
申请(专利权)人:网易杭州网络有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。