时长预测模型的训练方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:42902412 阅读:42 留言:0更新日期:2024-09-30 15:17
本申请提供了一种时长预测模型的训练方法、装置、计算机设备及存储介质,属于计算机技术领域。方法包括:对样本训练集进行划分,得到多个样本训练子集;对于任一样本训练子集,基于第一模型,对样本训练集中目标数量个点击负样本进行预测,得到目标数量个点击负样本的伪时长标签;基于目标数量个点击负样本、目标数量个点击负样本的伪时长标签、多个样本网络资源以及多个样本网络资源的真实时长标签,训练第二模型和第一模型,第二模型用于对样本网络资源发生点击后的浏览时长大于时长阈值的概率进行预测。上述技术方案通过充分利用点击正样本和点击负样本来进行训练,解决了样本选择偏差问题,从而提高了第二模型对时长预测的准确性。

【技术实现步骤摘要】

本申请涉及计算机,特别涉及一种时长预测模型的训练方法、装置、计算机设备及存储介质


技术介绍

1、随着计算机技术的发展,应用程序能够基于点击预测模型对多个网络资源的点击率进行预测,进而基于点击率的排序结果,为用户推荐网络资源,如视频、音频、新闻资讯、物品等,来满足用户的不同兴趣。然而,上述方式无法适用于多个网络资源的预测点击率相同的情况。因此,如何对预测点击率相同的网络资源进行排序,是一个需要解决的技术问题。

2、相关技术中,通常在点击预测模型的基础上引入时长预测模型,在对网络资源的点击率进行预测的同时,通过时长预测模型对网络资源发生点击后的浏览时长进行预测,进而根据网络资源的浏览时长的预测结果进行排序。

3、然而,曝光的网络资源中包括发生点击的网络资源和未发生点击的网络资源,且未发生点击的网络资源的数量远远多于发生点击的网络资源。由于上述方案在训练时长预测模型的过程中,仅采用发生点击的网络资源作为时长预测模型的训练样本。因此,存在训练数据量小、样本选择偏差和梯度更新冲突的问题,导致时长预测的准确率低。

<br/>

本文档来自技高网...

【技术保护点】

1.一种时长预测模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述目标数量个点击负样本、所述目标数量个点击负样本的伪时长标签、所述多个样本网络资源以及所述多个样本网络资源的真实时长标签,训练第二模型和所述第一模型,包括:

3.根据权利要求2所述的方法,其特征在于,所述对于任一样本网络资源,在所述样本网络资源为点击正样本的情况下,基于所述点击正样本和所述点击正样本的真实时长标签,训练所述第一模型和所述第二模型,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述第二模型,对所述点击正样本进行预测,...

【技术特征摘要】

1.一种时长预测模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述目标数量个点击负样本、所述目标数量个点击负样本的伪时长标签、所述多个样本网络资源以及所述多个样本网络资源的真实时长标签,训练第二模型和所述第一模型,包括:

3.根据权利要求2所述的方法,其特征在于,所述对于任一样本网络资源,在所述样本网络资源为点击正样本的情况下,基于所述点击正样本和所述点击正样本的真实时长标签,训练所述第一模型和所述第二模型,包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述第二模型,对所述点击正样本进行预测,得到所述点击正样本的预测时长标签,包括:

5.根据权利要求2所述的方法,其特征在于,所述对于任一点击负样本,基于所述点击负样本和所述点击负样本的伪时长标签,训练所述第二模型,包括:

6.根据权利要求5所述的方法,其特征在于,所述对于任一点击负样本,基于所述...

【专利技术属性】
技术研发人员:陈煜钊
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1