模型训练的方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:31483806 阅读:33 留言:0更新日期:2021-12-18 12:18
本申请实施例公开了一种模型训练的方法、装置、计算机设备及存储介质,可以预先获取第一行为样本,对待训练的特征提取模型进行无监督训练,然后将无监督训练得到的训练完成的特征提取模型,应用到用户游戏行为的预测任务中,利用无监督训练得到的特征提取模型对第二行为样本提取的特征向量,可以替代对海量的游戏行为数据进行标注后得到的特征,避免人工对海量的游戏行为数据进行标注,减少海量数据标注的出错率,降低数据标注的成本。降低数据标注的成本。降低数据标注的成本。

【技术实现步骤摘要】
模型训练的方法、装置、计算机设备及存储介质


[0001]本申请涉及模型训练
,具体涉及一种模型训练的方法、装置、计算机设备及存储介质。

技术介绍

[0002]为了增加用户的游戏体验感,游戏中通常会部署各类智能服务,例如,外挂检测、社交推荐、商品购买推荐等等。当向游戏中的用户推荐商品时,需要预测用户在游戏中购买虚拟物品的时机,然而预测用户购买时机的方法通常需要采集海量的游戏行为数据,对采集的数据进行标注,再进一步根据标注的数据进行模型训练。然而,对采集的海量数据进行标注会耗费较多的时间和人力,且出错率较高,导致数据标注的成本过高。

技术实现思路

[0003]本申请实施例提供一种模型训练的方法、装置、计算机设备及存储介质,避免对海量数据进行标注,减少海量数据标注的出错率,降低数据标注的成本。
[0004]本申请实施例提供一种模型训练的方法,包括:
[0005]获取待训练的特征提取模型的第一行为样本,所述第一行为样本包括用户在目标游戏中的多个历史行为序列;
[0006]将所述第一行为样本输入所述特征提取模本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种模型训练的方法,其特征在于,包括:获取待训练的特征提取模型的第一行为样本,所述第一行为样本包括用户在目标游戏中的多个历史行为序列;将所述第一行为样本输入所述特征提取模型,基于所述第一行为样本对所述特征提取模型进行无监督训练,得到训练完成的特征提取模型;基于所述训练完成的特征提取模型提取第二行为样本的特征向量,其中,所述第二行为样本包括用户在目标游戏中的多个历史行为序列,所述第二行为样本中的每个历史行为序列具有对应的标签,所述标签用于指示对应的历史行为序列后的预设时长内发生的目标行为的类型;将所述特征向量输入待训练的行为分类模型,通过所述行为分类模型预测所述第二行为样本中每个历史行为序列后的预设时长内发生的目标行为的类型,得到预测结果;基于所述预测结果和所述第二行为样本中的所述标签调整所述行为分类模型的参数,得到训练完成的行为分类模型。2.根据权利要求1所述的方法,其特征在于,所述获取待训练的特征提取模型的第一行为样本,包括:获取用户在所述目标游戏中的历史游戏行为记录;将所述历史游戏行为记录分割为多个行为信息,对所述多个行为信息进行排序,得到由所述多个行为信息组成的历史行为序列;根据所述历史行为序列得到所述第一行为样本。3.根据权利要求2所述的方法,其特征在于,所述行为信息包含用于表征行为的操作信息和用于表征行为对象的对象信息。4.根据权利要求2所述的方法,其特征在于,所述将所述历史游戏行为记录分割为多个行为信息,对所述多个行为信息进行排序,得到由所述多个行为信息组成的历史行为序列,包括:将所述历史游戏行为记录分割为多个行为信息,根据多个所述行为信息的发生时间先后顺序进行排序,形成初始行为序列;确定所述初始行为序列中的至少一组待合并行为信息,所述待合并行为信息包括至少两个相邻的行为信息,且所述待合并行为信息在所述初始行为序列中出现次数最多;合并每一组待合并历史行为信息包括的至少两个行为信息,在所述初始行为序列中形成新的行为信息,以更新所述初始行为序列;返回执行所述确定所述初始行为序列中的至少一组待合并行为信息的步骤,直到所述初始行为序列中的行为信息的数量达到预设数量,得到由所述预设数量的行为信息组成的历史行为序列。5.根据权利要求4所述的方法,其特征在于,所述确定所述初始行为序列中的至少一组待合并行为信息,包括:获取所述历史游戏行为记录中包括的全部行为信息,以及各个行为信息在所述历史游戏行为记录中的出现次数;根据各个行为信息,以及各个行为信息对应的出现次数,形成词表;在所述初始行为序列中获取至少两个相邻的行为信息,根据所述词表,获取所述至少
两个相邻的行为信息的出现次数总和;确定所述出现次数总和最多的至少两个相邻的行为信息,作为所述待合并行为信息。6.根据权利要求1所述的方法,其特征在于,所述历史行为序列包括多个行为信息,所述将所述第一行为样本输入所述特征提取模型,基于所述第一行为样本对所述特征提取模型进行无监督训练,得到训练完成的特征提取模型,包括:利用掩码替换所述第一行为样本中的至少一个历史行为序列中的至少一个行为信息;通过所述特征提取模型提取所述第一行为样本的特征向量;通过所述特征提取模型,基于所述特征向量预测所述第一行为样本中被所述掩码替换的行为信息,得到预测游戏行为信息;基于所述预测游戏行为信息和被所述掩码替换的行为信息,调整所述待训练的特征提取模型的参数,得到训练完成的特征提取模型。7.根据权利要求1所述的方法,其特征在于,所述基于所述训练完成的特征提取模型提取第二行为样本的特征向量前,还包括:获取所述用户在所述目标游戏中至少一个历史时间段内的行为信息,以及确定每一历史时间段之后的预设时长内所述用户发生目标行为的类型;基于所述用户的每一历史时间段内的行为信息生成第二行为样本,基于所述第二行为样本对应的历史时间段之后的预设时长内所述用户发生所述目标行为的类型设置所述第二行为样本的标签。8.根据权利要求1所述的方法,其特征在于,所述基于所述预测结果和所述第二行为样本中的所述标签调整所述待训练的行为分类模型的参数,得到训练完成的行为分类模型,包括:基于所述预测结果和所述第二行为样本中的所述标签计算行为分类损失,基于第一学习率和所述行为分类损失调整所述待训练的行为分类模型的参数,得到所述训练完成的行为分类模型;所述方法还包括:基于所述行为分类...

【专利技术属性】
技术研发人员:浦嘉澍毛晓曦吴润泽沈旭东范长杰胡志鹏
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1