【技术实现步骤摘要】
推荐模型训练方法和装置
[0001]本申请涉及计算机
,特别是涉及一种推荐模型训练方法、装置、计算机设备和存储介质。
技术介绍
[0002]随着人工智能技术的发展,出现了基于人工智能的推荐技术,比如,进行视频推荐、商品推荐、新闻推荐、广告推荐等等。目前,在建立人工智能推荐模型时,通常是针对各个子业务单独建立模型。比如,视频点击率推荐模型通常会基于点击率来进行视频推荐,并不会关注视频其他特征。最后将各个子业务模型的输出进行融合,得到融合后的结果,根据融合后的结果进行推荐。目前,在进行融合时,通常是对各个子业务模型的输出设立对应的权重,并进行加权融合,得到融合后的推荐结果。然而,只是简单的加权融合,会存在融合后的推荐结果不够精准的问题。
技术实现思路
[0003]基于此,提供一种能够提高推荐结果精准性的推荐模型训练方法、装置、计算机设备和存储介质。
[0004]一种推荐模型训练方法,所述方法包括:
[0005]获取训练样本,训练样本包括各个历史推荐目标,并获取至少二个已训练子目标模型分别对应 ...
【技术保护点】
【技术特征摘要】
1.一种推荐模型训练方法,其特征在于,所述方法包括:获取训练样本,所述训练样本包括各个历史推荐目标,并获取至少二个已训练子目标模型分别对应的子标签集,所述子标签集中包括各个历史推荐目标对应的子标签;将所述训练样本输入到所述已训练子目标模型中,得到各个已训练子目标模型输出的子推荐度集,所述子推荐度集中包括所述各个历史推荐目标对应的子推荐度;将各个子推荐度集输入到初始融合推荐模型中,得到融合推荐度集,所述融合推荐度集包括所述各个历史推荐目标对应的融合推荐度,基于所述融合推荐度将所述各个历史推荐目标进行排序,得到历史推荐目标序列;基于所述历史推荐目标序列的顺序将所述子标签集中各个历史推荐目标对应的子标签进行排序,得到所述各个已训练子目标模型分别对应的子标签序列;基于排序评价指标确定各个子标签序列对应的排序评价信息,基于所述各个子标签序列对应的排序评价信息确定目标排序评价信息;基于所述目标排序评价信息更新所述初始融合推荐模型,当训练完成时,得到目标融合推荐模型,所述目标融合推荐模型用于对待推荐信息进行推荐。2.根据权利要求1所述的方法,其特征在于,所述基于排序评价指标确定各个子标签序列对应的排序评价信息,包括:获取所述各个子标签序列对应的标签数据类型,基于所述标签数据类型确定所述各个子标签序列对应的排序评价指标,基于所述各个子标签序列对应的排序评价指标计算各个子标签序列对应的排序评价信息。3.根据权利要求2所述的方法,其特征在于,所述标签数据类型包括离散数据类型;所述基于所述标签数据类型确定所述各个子标签序列对应的排序评价指标,基于所述各个子标签序列对应的排序评价指标计算所述各个子标签序列对应的排序评价信息,包括:当第一子标签序列对应的标签数据类型为离散数据类型时,从所述第一子标签序列中确定第一类别子标签数量和第二类别子标签数量;从所述历史推荐目标序列中确定各个第一类别子标签对应的历史推荐目标位置标识,计算所述各个第一类别子标签对应的历史推荐目标位置标识的标识和;基于所述第一类别标签数量、所述第二类别标签数量和所述标识和计算所述第一子标签序列对应的第一排序评价信息。4.根据权利要求2所述的方法,其特征在于,所述标签数据类型包括连续数据类型;所述基于所述标签数据类型确定所述各个子标签序列对应的排序评价指标,基于所述各个子标签序列对应的排序评价指标计算所述各个子标签序列对应的排序评价信息,包括:当第二子标签序列对应的标签数据类型为连续数据类型时,计算所述第二子标签序列中正序对数量和序列对总数;计算所述正序对数量与所述序列对总数的比值,得到所述第二子标签序列对应的第二排序评价信息。5.根据权利要求4所述的方法,其特征在于,所述计算所述第二子标签序列中正序对数量,包括:
将所述第二子标签序列划分,得到第二子标签左序列和第二子标签右序列;计算所述第二子标签左序列的第一正序对数量并计算所述第二子标签右序列的第二正序对数量;计算所述第二子标签左序列与所述第二子标签右序列的交互正序对数量,基于所述第一正序对数量、所述第二正序对数量和所述交互正序对数量确定所述正序对数量。6.根据权利要求1所述的方法,其特征在于,所述基于所述各个子标签序列对应的排序评价信息确定目标排序评价信息,包括:获取所述各个已训练子目标模型对应的预设权重,基于所述各个已训练子目标模型对应的预设权重对所述各个子标签序列的排序评价信息进行加权计算,得到第一目标排序评价信息。7.根据权利要求6所述的方法,其特征在于,所述训练样本包括各个历史用户标识和每个历史用户标识对应的各个历史推荐目标;在所述获取所述各个已训练子目标模型对应的预设权重之前,还包括:获取所述每个历史用户标识的各个子标签序列对应的排序评价信息,并获取历史用户总数量;基于所述每个历史用户标识的各个子标签序列对应的排序评价信息和所述历史用户总数量进行平均计算,确定所述各个子标签序列对应的平均排序评价信息;所述基于所述各个已训练子目标模型对应的预设权重和所述各个子标签序列的排序评价信息进行加权计算,得到目标排序评价信息,包括:基于所述各个已训练子目标模型对应的预设权重和所述各个子标签序列对应的平均排序评价信息进行加权计算,得到第二目标排序评价信息。8.根据权利要求6所述的方法,其特征在于,所述训练样本包括各个历史用户标识和每个历史用户标识对应的各个历史推荐目标;在所述获取所述各个已训练子目标模型对应的预设权重之前,还包括:获取所述每个历史用户标识的各个子标签序列对应的排序评价信息,并获取所述每个历史用户标识对应的历史推荐目标数量;基于所述每个历史用户标识对应的历史推荐目标数量对所述每个历史用户标识的各个子标签序列对应的排序评价信息进行加权计算,得到所述各个子标签序列对应的加权排序评价信息;基于所述每个历史用户对应的历史推荐目标数量计算得到历史推荐目标总数量,计算所述各个子标签序列对应的加权排序评价信息与所述历史推荐目标总数量的比值,得到所述各个子标签序列对应的特定排序评价信息;所述基于所述各个已训练子目标模型对应的预设权重和所述各个子标签序列的排序评价信息进行加权计算,得到目标排序评价信息,包括:基于所述各个已训练子目标模型对应的预设权重和所述各个子标签序列对应的特定排序评价信息进行加权计算,得到第三目标排序评价信息。9.根据权利要求1所述的方法,其特征在于,基于所述目标排序评价信息更新所述初始融合推荐模型,当训练完成时,得到目标融合推荐模型,包括:当所述初始融合推荐模型符合预设条件时,基于所述目标排序评...
【专利技术属性】
技术研发人员:叶佳木,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。