【技术实现步骤摘要】
一种行为预测方法、装置及相关产品
[0001]本申请涉及机器学习
,尤其涉及一种行为预测方法、装置及相关产品。
技术介绍
[0002]随着互联网的快速发展,互联网上的内容越来越丰富,用户可以通过计算机设备在互联网上轻松接触到各种类型的内容,例如视频、书籍、商品、广告等。目前在许多互联网平台上,各式各样的内容已经呈现井喷之势。互联网平台的运营团队往往需要从海量内容中为用户提供其可能感兴趣的内容,因此海量的内容给运营团队带来了极大的挑战。内容推荐前执行的一个关键操作是对用户在待推荐的内容的多种行为(例如点击、订阅、评论、收藏等)进行预测。这一操作可以通过多任务学习来实现,多任务即对应于用户的多种行为。多任务学习是一种基于共享数据把多个相关的任务放在一起的一种机器学习方式。多任务学习将不同任务学习到相关领域的信息,然后基于这部分领域的信息在模型中进行共享,通过多个任务相互学习,相互共享,从而提升整个模型泛化能力与效果。
[0003]现有技术中,可以应用全空间多任务学习模型(Entire Space Multi >‑
tas本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种行为预测方法,其特征在于,包括:获取目标内容的特征序列;获取目标用户的N种历史行为序列,所述N种历史行为序列与N种行为一一对应,所述历史行为序列指示了行为对象和行为顺序;所述行为对象为与所述目标内容具有相同内容类型的内容;所述N为大于1的整数;基于所述N种历史行为序列和所述目标内容的特征序列进行共享特征提取处理,获得共享特征提取结果;基于所述N种历史行为序列分别进行个性化特征提取处理,获得所述N种历史行为序列一一对应的N个个性化特征提取结果;基于所述共享特征提取结果和目标历史行为序列对应的个性化特征提取结果预测所述目标用户在目标内容执行目标行为的概率;所述目标历史行为序列为所述N种历史行为序列中任意一种历史行为序列,所述目标行为为所述N种行为中与所述目标历史行为序列对应的行为。2.根据权利要求1所述的方法,其特征在于,所述方法基于多任务学习模型实现;所述多任务学习模型包括:共享特征提取模块、N个个性化特征提取模块和N个预测模块;所述基于所述共享特征提取结果和目标历史行为序列对应的个性化特征提取结果对所述目标用户在目标内容的目标行为进行预测,获得预测结果,包括:基于所述共享特征提取模块提供的共享特征提取结果和所述N个个性化特征提取模块中目标历史行为序列对应的个性化特征提取模块提供的个性化特征提取结果,通过目标预测模块预测所述目标用户在目标内容执行目标行为的概率;所述目标预测模块为所述N个预测模块中与所述目标行为对应的预测模块。3.根据权利要求2所述的方法,其特征在于,所述多任务学习模型还包括:共享特征处理模块;所述基于所述共享特征提取模块提供的共享特征提取结果和所述N个个性化特征提取模块中目标历史行为序列对应的个性化特征提取模块提供的个性化特征提取结果,通过目标预测模块预测所述目标用户在目标内容执行目标行为的概率,包括:通过所述共享特征处理模块基于所述共享特征提取结果进行特征提取和调控,为所述N种行为分别生成对应的共享特征处理结果;通过所述目标预测模块根据所述目标行为对应的共享特征处理结果和所述目标历史行为序列对应的个性化特征提取结果,预测所述目标用户在目标内容执行目标行为的概率。4.根据权利要求3所述的方法,其特征在于,所述共享特征处理模块包括至少一层门控共享网络层;所述门控共享网络层包括共享专家网络、与所述N种行为一一对应的N个独立专家网络和N个独立门控网络;所述共享专家网络用于基于所述N种行为的方向对所述共享特征提取结果进行学习;所述独立专家网络用于基于对应的待预测行为的方向对所述共享特征提取结果进行学习;所述独立门控网络用于对对应的所述独立专家网络的输出以及所述共享专家网络的输出进行权重控制,为对应的待预测行为生成所述共享特征处理结果。5.根据权利要求4所述的方法,其特征在于,所述至少一层门控共享网络层包括第1层
至第M层门控共享网络层,所述M为大于1的整数;第1层至第M
‑
1层门控共享网络层还包括共享门控网络;所述共享门控网络用于对同一所述门控共享网络层中的所述N个独立专家网络的输出以及所述共享专家网络的输出进行权重控制;所述共享特征提取结果作为第1层门控共享网络层中所述共享专家网络和N个所述独立专家网络的输入;在第L层门控共享网络层中,所述共享门控网络的输出作为第L+1层门控共享网络层中所述共享专家网络的输入,所述独立门控网络的输出作为所述第L+1层门控共享网络层中所述独立专家网络的输入;所述L取1至M
‑
1之间的整数;所述第M层门控共享网络层中所述N个独立门控网络的输出作为为所述N种行为生成的所述共享特征处理结果。6.根据权利要求2所述的方法,其特征在于,所述多任务学习模型为通过以下方式训练获得:获取训练样本;所述训练样本包括样本目标对象的特征序列和用户的N种样本行为序列,所述N种样本行为序列与所述N种行为一一对应,所述样本行为序列指示了行为对象和行为顺序;所述样本目标对象和所述样本行为序列中指示的行为对象均与所述目标内容的内容类型相同;所述训练样本的标签包括在所述N种样本行为序列之后所述用户在所述样本目标对象执行所述N种行为的实际值;通过待训练模型的共享特征提取模块对所述N种样本行为序列和所述样本目标对象的特征序列进行共享特征提取处理,获得样本共享特征提取结果;通过所述待训练模型的N个个性化特征提取模块分别对所述N种样本行为序列进行个性化特征提取处理,获得所述N种样本行为序列一一对应的N个样本个性化特征提取结果;基于所述样本共享特征提取结果和目标样本行为序列对应的样本个性化特征提取结果,通过所述待训练模型的N个预测模块中的目标预测模块预测所述用户在所述样本目标对象执行所述目标行为的概率;所述目标样本行为序列与所述目标行为对应;当所述待训练模型未满足训练截止...
【专利技术属性】
技术研发人员:张嘉荣,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。