用于生成点击率预测模型的方法和装置制造方法及图纸

技术编号:20566712 阅读:231 留言:0更新日期:2019-03-14 09:29
本申请实施例公开了用于生成点击率预测模型的方法和装置。该方法的一具体实施方式包括:响应于确定当前时间为目标时间,获取第一训练样本集合,其中,第一训练样本包括当前时间在目标用户的终端上展示的展示信息的特征信息、目标用户的用户信息,以及预先确定的、用于预测目标用户在当前时间点击展示信息的概率的实时点击概率、用于表征目标用户是否点击展示信息的标注信息;利用机器学习方法,将第一训练样本包括的用户信息、特征信息和实时点击概率作为输入,将输入各种信息对应的标注信息作为期望输出,训练得到点击率预测模型。该实施方式可以对模型进行实时地训练,有助于实时地更新模型,提高利用模型预测点击率的准确性。

【技术实现步骤摘要】
用于生成点击率预测模型的方法和装置
本申请实施例涉及计算机
,具体涉及用于生成点击率预测模型的方法和装置。
技术介绍
点击率又称点击通过率(CTR,ClickThroughRate),即某展示信息的实际点击次数除以展示信息的展示量(例如推送展示信息的次数或接收展示信息的终端的数量)的结果。根据点击率,可以反映信息展示的效果,并作为选择展示信息及推送展示信息的参考,从而可以提高信息推送的针对性。通过点击率预测模型,可以在展示信息推送之前,预测展示信息的点击率。训练点击率预测模型的训练样本,可以根据统计的一段时间内用户的行为(例如用户是否点击展示信息、点击的时间等)生成。
技术实现思路
本申请实施例提出了用于生成点击率预测模型的方法和装置,以及用于生成信息的方法和装置。第一方面,本申请实施例提供了一种用于生成点击率预测模型的方法,该方法包括:响应于确定当前时间为目标时间,获取第一训练样本集合,其中,第一训练样本包括当前时间在目标用户的终端上展示的展示信息的特征信息、目标用户的用户信息,以及预先确定的、用于预测目标用户在当前时间点击展示信息的概率的实时点击概率、用于表征目标用户是否点击展本文档来自技高网...

【技术保护点】
1.一种用于生成点击率预测模型的方法,包括:响应于确定当前时间为目标时间,获取第一训练样本集合,其中,第一训练样本包括当前时间在目标用户的终端上展示的展示信息的特征信息、目标用户的用户信息,以及预先确定的、用于预测目标用户在当前时间点击展示信息的概率的实时点击概率、用于表征目标用户是否点击展示信息的标注信息;利用机器学习方法,将所述第一训练样本集合中的第一训练样本包括的用户信息、特征信息和实时点击概率作为输入,将输入的用户信息、特征信息和实时点击概率对应的标注信息作为期望输出,训练得到点击率预测模型。

【技术特征摘要】
1.一种用于生成点击率预测模型的方法,包括:响应于确定当前时间为目标时间,获取第一训练样本集合,其中,第一训练样本包括当前时间在目标用户的终端上展示的展示信息的特征信息、目标用户的用户信息,以及预先确定的、用于预测目标用户在当前时间点击展示信息的概率的实时点击概率、用于表征目标用户是否点击展示信息的标注信息;利用机器学习方法,将所述第一训练样本集合中的第一训练样本包括的用户信息、特征信息和实时点击概率作为输入,将输入的用户信息、特征信息和实时点击概率对应的标注信息作为期望输出,训练得到点击率预测模型。2.根据权利要求1所述的方法,其中,对于所述第一训练样本集合中的第一训练样本,该第一训练样本包括的实时点击概率预先通过如下步骤得到:获取该第一训练样本包括的特征信息对应的展示信息的推送时间,其中,推送时间为向目标用户的终端推送展示信息的时间;确定当前时间和所获取的推送时间的时间差值;将所确定的时间差值、该第一训练样本包括的特征信息和该第一训练样本包括的用户信息输入预先训练的实时点击概率预测模型,得到实时点击概率。3.根据权利要求2所述的方法,其中,所述实时点击概率预测模型预先通过如下步骤训练得到:获取第二训练样本集合,其中,第二训练样本包括样本展示信息的特征信息、浏览样本展示信息的样本用户的用户信息、样本用户点击样本展示信息的时间与向样本用户的终端推送样本展示信息的时间的时间差值,以及预先标注的、用于表征样本用户点击样本展示信息的标注信息;利用机器学习方法,将所述第二训练样本集合中的第二训练样本包括的特征信息、用户信息、时间差值作为输入,将与输入的特征信息、用户信息、时间差值对应的标注信息作为期望输出,训练得到实时点击概率预测模型。4.一种用于生成信息的方法,包括:获取至少一个特征信息,其中,特征信息用于表征待向目标用户的终端推送的待展示信息的特征;获取所述目标用户的用户信息;对于所述至少一个特征信息中的特征信息,将该特征信息、所述用户信息、预设的默认实时点击概率输入预先训练的点击率预测模型,得到用于预测该特征信息指示的待展示信息的点击率的预测点击率,其中,所述点击率预测模型是根据权利要求1-3之一的方法生成的。5.根据权利要求4所述的方法,其中,在所述对于所获取的至少一个特征信息中的特征信息,将该特征信息、所述用户信息、预设的默认实时点击概率输入预先训练的点击率预测模型,得到用于预测所述待展示信息的点击率的预测点击率之后,所述方法还包括:基于所得到的预测点击率的大小,从所述至少一个特征信息中的特征信息对应的待展示信息中,选择待展示信息;将所选择的待展示信息推送至所述目标用户的终端。6.一种用于生成点击率预测模型的装置,包括:获取单元,被配置成响应于确定当前时间为目标时间,获取第一训练样本集合,其中,第一训练...

【专利技术属性】
技术研发人员:谷长胜洪春晓
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1