预测方法、装置、服务器及存储介质制造方法及图纸

技术编号:29133448 阅读:9 留言:0更新日期:2021-07-02 22:28
本公开关于一种预测方法、装置、服务器及存储介质,属于互联网技术领域,该方法包括:确定第一展示数据和第一样本激活率,基于第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定发布者的目标参数,再对激活率预测模型进行训练。本公开实施例中,考虑到了推荐数据所属发布者的目标参数,根据该目标参数,能够获知发布者的推荐数据在展示后第一时长内的激活次数、与第二时长内的激活次数之间的关系,这样,对于激活率预测模型来说,增加了所参考的激活情况,能够提升训练激活率预测模型的准确性。

【技术实现步骤摘要】
预测方法、装置、服务器及存储介质
本公开涉及互联网
,尤其涉及一种预测方法、装置、服务器及存储介质。
技术介绍
随着数据推荐技术的蓬勃发展,很多应用程序的开发者会在互联网中发布包括该应用程序的推荐数据,如某应用程序的广告视频等,使得用户能够对该推荐数据中的应用程序执行展示、点击、下载、注册的操作,在注册完成后就相当于激活了该推荐数据一次。在每次展示某一推荐数据时,通常会利用激活率预测模型对该推荐数据的激活率进行预测,而在激活率预测模型的训练阶段,通常会获取展示数据,该展示数据用于指示对推荐数据的一次展示事件,根据推荐数据在展示事件之后的激活情况,来对激活率预测模型进行训练。然而,由于推荐数据激活情况的不确定性,使得所训练的激活率预测模型的准确性较低。
技术实现思路
本公开提供一种预测方法、装置、服务器及存储介质,能够提高训练激活率预测模型的准确性。本公开的技术方案如下:根据本公开实施例的第一方面,提供一种预测方法,该方法包括:确定第一展示数据和第一样本激活率,该第一展示数据用于指示对第一推荐数据的一次展示事件,该第一样本激活率表示该第一推荐数据在该展示事件之后的第一时长内被激活;基于该第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定该发布者的目标参数,该第一激活次数为由该发布者发布的推荐数据在展示后的该第一时长内被激活的次数,该第二激活次数为由该发布者发布的推荐数据在展示后的第二时长内被激活的次数,该第二时长大于该第一时长;基于该第一展示数据、该第一样本激活率和该目标参数,对激活率预测模型进行训练;基于训练得到的激活率预测模型,进行激活率的预测。本公开实施例中,考虑到了推荐数据所属发布者的目标参数,根据该目标参数,能够获知发布者的推荐数据在展示后第一时长内的激活次数、与第二时长内的激活次数之间的关系,这样,对于激活率预测模型来说,增加了所参考的激活情况,能够提升训练激活率预测模型的准确性。在一些实施例中,基于该第一展示数据、该第一样本激活率和该目标参数,对激活率预测模型进行训练包括:将该第一展示数据输入该激活率预测模型,通过该激活率预测模型,对该第一展示数据进行预测,得到第一预测激活率;基于该第一样本激活率、该第一预测激活率以及该目标参数,确定该激活率预测模型的损失值;基于该损失值,对该激活率预测模型的模型参数进行更新。本公开实施例中,在进行模型训练的过程中,根据目标参数以及第一样本激活率、第一预测激活率,来确定损失值,参考了目标参数,也即是参考了第一推荐数据所属发布者的推荐数据在展示后第一时长与第二时长的激活次数之间的关系,提升了确定损失值的准确性,进而提升了训练激活率预测模型的准确性。在一些实施例中,基于该第一样本激活率、该第一预测激活率以及该目标参数,确定该激活率预测模型的损失值包括:基于该第一样本激活率和该第一预测激活率,确定该第一展示数据对应的第一交叉熵;基于该目标参数,确定交叉熵系数;基于该交叉熵系数,对该第一交叉熵进行调整,得到第二交叉熵;基于该第二交叉熵,确定该激活率预测模型的损失值。本公开实施例中,通过基于目标参数所确定的交叉熵系数,来对第一展示数据对应的第一交叉熵进行调整,由于目标参数能够表示展示后第一时长与第二时长的激活次数之间的关系,且第一展示数据对应展示后第一时长内被激活的第一推荐数据,因此通过上述调整的过程,能够确定出同属发布者的推荐数据中,在展示后第二时长内可能被激活的次数,这样,对于激活率预测模型来说,还参考了第二时长内的激活情况,增加了所参考的激活情况,能够提升训练激活率预测模型的准确性。在一些实施例中,第一展示数据包括多个,该基于该第二交叉熵,确定该激活率预测模型的损失值包括:基于该多个第一展示数据对应的该目标参数,确定损失值系数;基于该损失值系数,对该多个第一展示数据对应的该第二交叉熵进行调整,得到该激活率预测模型的损失值。本公开实施例中,通过基于目标参数所确定的损失值系数,来对多个第二交叉熵进行调整,如此,在多个第一展示数据的情况下,考虑到了每个第一展示数据对应的第一推荐数据在展示后第二时长内、可能被激活的次数,提升了确定损失值的准确性。在一些实施例中,该方法还包括:确定第二展示数据和第二样本激活率,该第二展示数据用于指示对第二推荐数据的一次展示事件,该第二样本激活率表示该第二推荐数据在该展示事件之后的该第一时长内未被激活;该基于该第一样本激活率、该第一展示数据的预测激活率以及该目标参数,确定该激活率预测模型的损失值之前,该方法还包括:将该第二展示数据输入该激活率预测模型,通过该激活率预测模型,对该第二展示数据进行预测,得到第二预测激活率;该基于该第一样本激活率、该第一预测激活率以及该目标参数,确定该激活率预测模型的损失值包括:基于该第二样本激活率和该第二预测激活率,确定该第二展示数据对应的第三交叉熵;基于该第二交叉熵与该第三交叉熵,确定该激活率预测模型的损失值。本公开实施例中,在激活率预测模型的输入既包括第一展示数据,又包括第二展示数据的情况下,根据第一展示数据对应的第二交叉熵以及第二展示数据对应的第三交叉熵,来确定该激活率预测模型的损失值,在该过程中,确定了第一展示数据的目标参数,且基于该目标参数对第一展示数据的第一交叉熵进行了调整,能够保证确定损失值的准确性。在一些实施例中,该第二展示数据包括一个或多个,基于该第二交叉熵与该第三交叉熵,确定该激活率预测模型的损失值包括:基于该目标参数与该第二展示数据的数量,确定损失值系数;基于该损失值系数,对该第二交叉熵与该第三交叉熵进行调整,得到该激活率预测模型的损失值。本公开实施例中,通过基于目标参数和展示数据的数量所确定的损失值系数,来对多个交叉熵进行调整,在多个展示数据的情况下,考虑到其中第一展示数据所对应的目标参数,进而能够考虑到在展示后第二时长内的激活情况,提升了确定损失值的准确性。在一些实施例中,基于该第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定该发布者的目标参数包括:获取由该发布者发布且在当前周期对应的历史周期内展示的推荐数据的激活记录,该历史周期与该当前周期间隔该第二时长;基于该激活记录,确定该发布者的第一激活次数和第二激活次数;基于该发布者的第一激活次数和第二激活次数,确定该发布者的目标参数。本公开实施例中,根据发布者在历史周期内展示的推荐数据的激活记录,能够确定出该发布者的第一激活次数和第二激活次数,进而能够快速确定出发布者的目标参数,提高了确定目标参数的效率,以便于后续模型的训练过程。在一些实施例中,基于该第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定该发布者的目标参数包括:获取由该发布者发布且在当前周期对应的历史周期内展示的推荐数据的激活记录本文档来自技高网...

【技术保护点】
1.一种预测方法,其特征在于,所述方法包括:/n确定第一展示数据和第一样本激活率,所述第一展示数据用于指示对第一推荐数据的一次展示事件,所述第一样本激活率表示所述第一推荐数据在所述展示事件之后的第一时长内被激活;/n基于所述第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定所述发布者的目标参数,所述第一激活次数为由所述发布者发布的推荐数据在展示后的所述第一时长内被激活的次数,所述第二激活次数为由所述发布者发布的推荐数据在展示后的第二时长内被激活的次数,所述第二时长大于所述第一时长;/n基于所述第一展示数据、所述第一样本激活率和所述目标参数,对激活率预测模型进行训练;/n基于训练得到的激活率预测模型,进行激活率的预测。/n

【技术特征摘要】
1.一种预测方法,其特征在于,所述方法包括:
确定第一展示数据和第一样本激活率,所述第一展示数据用于指示对第一推荐数据的一次展示事件,所述第一样本激活率表示所述第一推荐数据在所述展示事件之后的第一时长内被激活;
基于所述第一推荐数据所属发布者的第一激活次数与第二激活次数的关系,确定所述发布者的目标参数,所述第一激活次数为由所述发布者发布的推荐数据在展示后的所述第一时长内被激活的次数,所述第二激活次数为由所述发布者发布的推荐数据在展示后的第二时长内被激活的次数,所述第二时长大于所述第一时长;
基于所述第一展示数据、所述第一样本激活率和所述目标参数,对激活率预测模型进行训练;
基于训练得到的激活率预测模型,进行激活率的预测。


2.根据权利要求1所述的预测方法,其特征在于,所述基于所述第一展示数据、所述第一样本激活率和所述目标参数,对激活率预测模型进行训练包括:
将所述第一展示数据输入所述激活率预测模型,通过所述激活率预测模型,对所述第一展示数据进行预测,得到第一预测激活率;
基于所述第一样本激活率、所述第一预测激活率以及所述目标参数,确定所述激活率预测模型的损失值;
基于所述损失值,对所述激活率预测模型的模型参数进行更新。


3.根据权利要求2所述的预测方法,其特征在于,所述基于所述第一样本激活率、所述第一预测激活率以及所述目标参数,确定所述激活率预测模型的损失值包括:
基于所述第一样本激活率和所述第一预测激活率,确定所述第一展示数据对应的第一交叉熵;
基于所述目标参数,确定交叉熵系数;
基于所述交叉熵系数,对所述第一交叉熵进行调整,得到第二交叉熵;
基于所述第二交叉熵,确定所述激活率预测模型的损失值。


4.根据权利要求3所述的预测方法,其特征在于,所述第一展示数据包括多个,所述基于所述第二交叉熵,确定所述激活率预测模型的损失值包括:
基于所述多个第一展示数据对应的所述目标参数,确定损失值系数;
基于所述损失值系数,对所述多个第一展示数据对应的所述第二交叉熵进行调整,得到所述激活率预测模型的损失值。


5.根据权利要求3所述的预测方法,其特征在于,所述方法还包括:
确定第二展示数据和第二样本激活率,所述第二展示数据用于指示对第二推荐数据的一次展示事件,所述第二样本激活率表示所述第二推荐数据在所述展示事件之后的所述第一时长内未被激活;
所述基于所述第一样本激活率、所述第一...

【专利技术属性】
技术研发人员:刘懿
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1