【技术实现步骤摘要】
推荐模型训练方法、对象推荐方法、装置及存储介质
[0001]本公开涉及互联网应用
,尤其涉及一种推荐模型训练方法、对象推荐方法、装置及存储介质。
技术介绍
[0002]近年来,深度学习技术在众多领域得到了广泛应用。同时,深度学习模型结构也变得越来越复杂,网络越来越深,模型参数数量越来越多,对系统性能挑战也越来越大。在推荐场景中,一般粗排模型的模型结构比精排模型的结构简单,但推荐精准度不如精排模型。为了均衡模型复杂度和推荐精度,一般使用蒸馏的方法,让粗排模型(学生模型)去学习精排模型(教师模型)的知识。
[0003]相关技术中,一般选择离线蒸馏,整个训练过程有两个阶段。首先,离线训练教师模型;然后利用教师模型指导学生模型学习。或者选择在线蒸馏,即教师模型和学生模型同时从零开始训练更新,整个学习过程是端到端的框架。前者导致学生模型只学习到教师模型最后一层输出信息,教师模型得到的知识有限,效果更差。后者由于教师模型还没训练充分,使得教师模型可能被学生模型带偏,且这样的教师模型用于指导学生模型也不准确。
专利技 ...
【技术保护点】
【技术特征摘要】
1.一种推荐模型训练方法,其特征在于,包括:获取多个第一样本训练数据、多个第二样本训练数据以及对应的标签信息,所述多个第一样本训练数据是基于多个样本用户账号的样本用户关联信息和多个样本对象各自的样本对象关联信息得到的,所述多个第二样本训练数据是基于所述多个第一样本训练数据与样本交互信息得到的,所述样本交互信息为所述多个样本用户账号与所述多个样本对象的样本交互信息;将所述多个第一样本训练数据输入第一模型,得到第一预测结果;将所述多个第二样本训练数据输入第二模型,得到第二预测结果;所述第二模型为预先训练的、满足预设收敛条件的预设机器学习模型;基于所述第一预测结果、所述第二预测结果和所述标签信息,训练所述第一模型和所述第二模型,直至第一模型满足预设条件,将满足预设条件的第一模型作为目标推荐模型。2.根据权利要求1所述的方法,其特征在于,所述获取多个第一样本训练数据、多个第二样本训练数据,包括:获取多个样本用户账号各自的样本用户关联信息、多个样本对象各自的样本对象关联信息、以及所述多个样本用户账号与所述多个样本对象的样本交互信息;所述样本用户关联信息是基于所述样本用户账号的样本用户属性信息和样本历史行为信息得到的;将多个样本用户关联信息与多个样本对象关联信息进行组合处理,得到所述多个第一样本训练数据;基于所述多个第一样本训练数据以及对应的样本交互信息,得到第二样本训练数据。3.根据权利要求1所述的方法,其特征在于,所述基于所述第一预测结果、所述第二预测结果和所述标签信息,训练所述第一模型和所述第二模型,直至第一模型满足预设条件,将满足预设条件的第一模型作为目标推荐模型,包括:根据所述第一预测结果和所述标签信息,确定第一损失信息;根据所述第一预测结果和所述第二预测结果,确定第二损失信息;根据所述第二预测结果和所述标签信息,确定第三损失信息;利用所述第一损失信息和所述第二损失信息训练所述第一模型,并利用所述第三损失信息训练所述第二模型以更新第二模型,直至第一模型满足预设条件,将满足所述预设条件的第一模型作为目标推荐模型。4.根据权利要求2所述的方法,其特征在于,所述获取多个样本用户账号各自的样本用户关联信息,包括:获取所述样本用户账号的样本用户基础属性信息、关联设备信息、关联网络环境信息、所述样本用户账号关联的第一样本账号信息、所述样本用户账号与历史交互对象的历史操作信息;其中,所述历史交互对象为所述样本用户账号执行过预设操作的对象;根据所述样本用户基础属性信息、所述关联设备信息和所述关联网络环境信息中的至少一种,获取所述样本用户账号的样本用户属性信息;基于所述第一样本账号信息和所述历史操作信息,获取所述多个样本用户账号各自的样本历史行为信息;基于所述样本属性信息和所述样本历史行为信息,获取所述多个样本用户账号各自的样本用户关联信...
【专利技术属性】
技术研发人员:王龙甫,方美玲,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。