【技术实现步骤摘要】
训练推荐概率预测模型的方法、推荐概率预测方法及装置
本申请涉及人工智能
,尤其涉及一种训练推荐概率预测模型的方法、推荐概率预测方法及装置。
技术介绍
随着互联网技术的不断发展,各种网络信息层出不穷,例如文章、视频、图片、商品、广告等等,使得信息推荐系统得到了广泛应用。在实际应用中,当通过信息推荐系统向目标对象推荐文章、视频、图片等信息时,目的是达到以下推荐效果:目标对象点击了推荐信息,然后看完推荐信息的全部内容,并进行点赞、转发、评论等互动。相关技术下,为了达到上述推荐效果,信息推荐系统通常采用训练后的多任务学习模型对各个待推荐信息的推荐概率进行预测,进而根据各个待推荐信息的推荐概率选择目标推荐信息。具体地,多任务学习模型可以通过多个神经网络学习不同维度的特征,进而结合多个神经网络的输出结果,分别预测点击率、观看完成率、互动率等推荐概率。多任务学习模型的多个神经网络的输出结果具有差异性,有利于提升模型对于多个任务的预测性能。但是,目前的多任务学习模型通常存在多个神经网络的输出结果趋同的问题,即多个神经网 ...
【技术保护点】
1.一种训练推荐概率预测模型的方法,其特征在于,包括:/n基于样本数据集对待训练的推荐概率预测模型进行多轮迭代训练,直到满足预设的收敛条件为止,并将最后一轮输出的推荐概率预测模型作为目标推荐概率预测模型,所述推荐概率预测模型包括多个任务网络,每个任务网络用于从一个特征维度对输入至所述推荐概率预测模型的样本数据进行特征提取,其中,在一轮迭代训练过程中,执行以下操作:/n将从所述样本数据集中获取的样本数据,输入所述推荐概率预测模型,获得所述样本数据对应的预测推荐结果;/n根据所述样本数据对应的预测推荐结果和实际推荐结果,获得相应的基本损失值;/n基于所述基本损失值和第一调整值, ...
【技术特征摘要】
1.一种训练推荐概率预测模型的方法,其特征在于,包括:
基于样本数据集对待训练的推荐概率预测模型进行多轮迭代训练,直到满足预设的收敛条件为止,并将最后一轮输出的推荐概率预测模型作为目标推荐概率预测模型,所述推荐概率预测模型包括多个任务网络,每个任务网络用于从一个特征维度对输入至所述推荐概率预测模型的样本数据进行特征提取,其中,在一轮迭代训练过程中,执行以下操作:
将从所述样本数据集中获取的样本数据,输入所述推荐概率预测模型,获得所述样本数据对应的预测推荐结果;
根据所述样本数据对应的预测推荐结果和实际推荐结果,获得相应的基本损失值;
基于所述基本损失值和第一调整值,获得相应的目标损失值;其中,所述第一调整值用于表征基于相应的样本数据获得的,每两个任务网络的输出结果的总差异程度,且所述第一调整值与所述目标损失值呈负相关;
根据所述目标损失值,对所述推荐概率预测模型进行参数调整。
2.如权利要求1所述的方法,其特征在于,所述将从所述样本数据集中获取的样本数据,输入所述推荐概率预测模型,获得所述样本数据对应的预测推荐结果,包括:
将从所述样本数据集中获取的样本数据,输入所述推荐概率预测模型,分别获得所述多个任务网络各自的输出结果以及所述多个任务网络各自对应的权重,并根据获得的各个输出结果和相应的权重,确定所述样本数据对应的预测推荐结果;
所述第一调整值通过如下方式获得:
分别获得所述多个任务网络中,每两个任务网络的输出结果之间的第一差异值,并基于获得的各个第一差异值,获得所述第一调整值。
3.如权利要求2所述的方法,其特征在于,所述多个任务网络各自的输出结果为输出向量;
所述分别获得所述多个任务网络中,每两个任务网络对应的输出结果之间的第一差异值,并基于获得的各个第一差异值,获得所述第一调整值,包括:
分别获取所述多个任务网络中,每两个任务网络对应的输出向量之间的第一距离,以及将获得的各个第一距离分别作为相应的第一差异值;
对获得的各个第一差异值执行求和操作,获得所述第一调整值。
4.如权利要求2所述的方法,其特征在于,所述预测推荐结果包括针对预设的多个预测维度的预测推荐概率;
所述将从所述样本数据集中获取的样本数据,输入所述推荐概率预测模型,分别获得所述多个任务网络各自的输出结果以及所述多个任务网络各自对应的权重,并根据获得的各个输出结果和相应的权重,确定所述样本数据对应的预测推荐结果,包括:
将从所述样本数据集中获取的样本数据,输入所述推荐概率预测模型,分别获得所述多个任务网络各自的输出结果,以及获得所述多个任务网络各自在所述多个预测维度下的权重;
根据所述多个任务网络各自在所述多个预测维度下的权重,分别获得所述多个预测维度各自对应的权重向量,其中,每个维度对应的权重向量包含的各个元素,分别与所述多个任务网络各自在相应维度下对应的权重一一对应;
针对所述多个预测维度,分别执行以下操作:根据一个预测维度对应的权重向量,以及所述多个任务网络各自的输出结果,确定所述样本数据在所述一个预测维度下对应的预测推荐概率。
5.如权利要求4所述的方法,其特征在于,所述推荐概率预测模型还包括多个预测网络,每个预测网络用于获得一个预测维度的预测推荐概率;
所述根据一个预测维度对应的权重向量,以及所述多个任务网络各自的输出结果,确定所述样本数据在所述一个预测维度下对应的预测推荐概率,包括:
将所述一个预测维度对应的权重向量中的各个元素,分别与相应的任务网络的输出结果进行融合,得到所述一个预测维度对应的最终输出结果;
将所述一个预测维度对应的最终输出结果输入相应的预测网络,获得所述样本数据在所述一个预测维度下对应的预测推荐概率。
6.如权利要求4所述的方法,其特征在于,所述分别获得所述多个预测维度各自对应的权重向量之后,所述基于所述基本损失值和所述第一调整值,获得相应的目标损失值之前,所述方法还包括:
分别获得所述预设的多个预测维度中,每两个预测维度对应的权重向量之间的第二差异值,并基于获得的各个第二差异值,获得第二调整值;其中,所述第二调整值用于表征基于相应的样本数据获得的,每两个预测维度对应的多个任务网络的权重向量的总差异程度,且所述第二调整值与所述目标损失值呈负相关;
所述基于所述基本损失值和所述第一调整值,获得相应的目标损失值,包括:
基于所述基本损失值、所述第一调整值和...
【专利技术属性】
技术研发人员:伍海洋,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。