点击率预估方法、装置、机器设备和计算机可读存储介质制造方法及图纸

技术编号:22168552 阅读:22 留言:0更新日期:2019-09-21 11:17
本发明专利技术揭示了一种点击率预估方法、装置、机器设备和计算机可读存储介质。所述方法包括:获取用户标签;获取用户相对资源的点击率预估中使用的逻辑回归参数以及用户标签对资源的影响值,影响值用于描述用户标签对于资源处于点击类别的贡献;针对每一资源根据逻辑回归参数以及用户标签对资源的影响值对用户标签以及所对应资源特征运算用户对资源的点击率预测值。在此运算中,通过用户标签对资源的影响值实现了用户标签与资源本身特性的组合,带来更多信息量,能够降低点击率预估的偏差,提高点击率预测值的准确性,也在用户标签对资源的影响值的作用下,屏蔽了用户标签的质量参差不齐以及由此而导致的不稳定情况。

Click Rate Prediction Method, Device, Machine Equipment and Computer Readable Storage Media

【技术实现步骤摘要】
点击率预估方法、装置、机器设备和计算机可读存储介质
本专利技术涉及计算机应用
,特别涉及一种点击率预估方法、装置、机器设备和计算机可读存储介质。
技术介绍
随着互联网应用技术的发展,通过向用户进行的前端显示而实现向用户的资源投放,例如,互联网广告的投放。投放的实现依赖对所投放资源的点击率预估,在为用户运算得到每一资源所对应的点击率预测值之后,即可按照这一点击率预测值选取向此用户投放的资源。由此便能够对每一用户都能够推荐其所感兴趣的资源。由此可见,资源的点击率预估对于互联网广告等资源的投放至关重要。点击率预估是根据用户标签运算得到,但是,每一用户的用户标签纷繁复杂,质量参差不齐,另外对于互联网广告等资源而言,生命周期短,新广告等的更新层出不穷。因此,如何利用好所有用户标签对新旧资源进行预测,已经成为一个具有挑战的难题。以互联网广告为例,往往需要针对用户的喜好,通过所运算的点击率预测值在短时间内从候选的互联网广告中选择出一款此用户喜欢的广告展示出来。获得点击率预测值所应用的点击率预估模型可以是线性模型或者深度神经网络等非线性模型。但是,受限于纷繁复杂质量参差不齐的用户标签,以及新旧资源层出不穷所带来的模型训练样本量小,进而使得点击率预估所能够获得的信息量小,面向资源投放所进行的资源点击率预估存在着非常大的偏差。亟待提供一种能够适应于各种状况下的用户标签且样本量小的点击率预估技术。
技术实现思路
为了解决相关技术中由于用户标签纷繁复杂质量参差不齐且样本量小而导致点击率预估存在较大偏差的技术问题,本专利技术提供了一种点击率预估方法、装置、机器设备和计算机可读存储介质。一种点击率预估方法,所述方法包括:获取用户标签,所述用户标签用于描述请求进行资源投放的用户;获取所述用户相对资源的点击率预估中使用的逻辑回归参数,以及获取用户标签对所述资源的影响值,所述影响值用于描述所述用户标签对于所述资源处于点击类别的贡献;针对每一资源,根据所述逻辑回归参数以及用户标签对所述资源的影响值对所述用户标签以及所对应资源特征运算所述用户对所述资源的点击率预测值。一种点击率预估装置,所述装置包括:标签获取模块,用于获取用户标签,所述用户标签用于描述请求进行资源投放的用户;参数获取模块,用于获取所述用户相对资源的点击率预估中使用的逻辑回归参数,以及获取用户标签对所述资源的影响值,所述影响值用于描述所述用户标签对于所述资源处于点击类别的贡献;特征运算模块,用于针对每一资源,根据所述逻辑回归参数以及用户标签对所述资源的影响值对所述用户标签以及所对应资源特征运算所述用户对所述资源的点击率预测值。一种机器设备,包括:处理器;以及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如前所述的点击率预估方法。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前所述的点击率预估方法。本专利技术的实施例提供的技术方案可以包括以下有益效果:在携带进行资源投放请求的用户流量到达后台时,对于请求进行资源投放的用户,首先获取相应用户标签,用户标签用于描述用户,将通过用户标签对此用户进行每一资源的点击率预估,在运算用户对于每一资源的点击率预测值之前,将获取所有资源所分别对应的逻辑回归参数,以及获取用户标签对资源的影响值,此影响值用于描述用户标签对于资源处于点击类别贡献,即指示了用户标签对于发生用户对此资源点击行为的影响,最后即可针对于每一资源,根据所对应逻辑回归参数以及用户标签对资源的影响值对用户标签运算用户对此资源的点击率预测值,在此运算中,通过用户标签对资源的影响值实现了用户标签与资源本身特性的组合,一方面带来了更多的信息量,进而能够降低点击率预估的偏差,提高点击率预测值的准确性,另一方面也在用户标签对资源的影响值的作用下以及用户标签对资源影响值的参与运算,使得用户标签和资源的深层特性以及关联性被挖掘且应用于点击率预测值的运算中,屏蔽了用户标签的质量参差不齐以及由此而导致的不稳定情况,既坚固了信息量也保证了稳定性。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本专利技术。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并于说明书一起用于解释本专利技术的原理。图1是根据一示例性实施例示出的本专利技术所涉及实施环境的示意简略图;图2是根据一示例性实施例示出的一种装置的框图;图3是根据一示例性实施例示出的一种点击率预估方法的流程图;图4是根据另一示例性实施例示出的一种点击率预估方法的流程图;图5是根据图4对应实施例示出的对步骤430进行描述的流程图;图6是根据一示例性实施例示出的广告业务架构示意图;图7是根据一示例性实施例示出的本专利技术实现点击率预估所使用的建模图形示意图;图8是根据一示例性实施例示出的点击率预估中使用梯度下降法参数更新流程图;图9是一示例性实施例示出的一种点击率预估装置的框图;图10是另一示例性实施例示出的一种点击率预估装置的框图;图11是根据图10对应实施例示出的对参数更新模块进行描述的框图。具体实施方式这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本专利技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本专利技术的一些方面相一致的装置和方法的例子。图1是根据一示例性实施例示出的本专利技术所涉及实施环境的示意简略图。在一个示例性实施例中,本专利技术所实现的点击率预估承载于后台所部署的机器上,以在此为所到达用户流量实现每一用户的资源点击率预估,将为此用户获得的点击率预测值推送至部署了推荐系统的机器,在此推荐系统按照点击率预测值选取所投放的资源之后,便可通过所配合的前端系统向此用户投放。在此,所指的机器,比如服务器110,提供点击率预估甚至于推荐服务,进而支持各种场景。在一支持的场景中,如图1所示的,后台部署了配置实现点击率预估的服务110,用以实现点击率预估系统;除此之外,后台还部署了配置实现推荐服务的推荐系统130以及前端系统150。以互联网广告这一资源为例,在服务器110所实现点击率预估系统、推荐系统130以及前端系统150的作用下,为到达的用户流量进行点击率预估,进而即可由推荐系统130依据点击率预测值获得推荐的互联网广告,并在前端系统150的配合下,对用户实现千人千面的广告投放效果。并且由于所投放的互联网广告是对应于用户的点击率预测值的,并有能够通过本专利技术所实现的点击率预估保证准确性,故所投放的互联网广告向用户曝光之后,被点击、转化的可能性极大。图2是根据一示例性实施例示出的一种装置的框图。例如,装置200可以是图1所示的推荐服务器。参照图2,该装置200可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessingunits,CPU)222(例如,一个或一个以上处理器)和存储器232,一个或一个以上存储应用程序242或数据244的存储介质230(例如一个或一个以上海量存储设备)。其中,存储器232和存储介质230可以是短暂存储或持久存储。存储在存储介质23本文档来自技高网...

【技术保护点】
1.一种点击率预估方法,其特征在于,所述方法包括:获取用户标签,所述用户标签用于描述请求进行资源投放的用户;获取所述用户相对资源的点击率预估中使用的逻辑回归参数,以及获取用户标签对所述资源的影响值,所述影响值用于描述所述用户标签对于所述资源处于点击类别的贡献;针对每一资源,根据所述逻辑回归参数以及用户标签对所述资源的影响值,对所述用户标签以及所对应资源特征运算所述用户对所述资源的点击率预测值。

【技术特征摘要】
1.一种点击率预估方法,其特征在于,所述方法包括:获取用户标签,所述用户标签用于描述请求进行资源投放的用户;获取所述用户相对资源的点击率预估中使用的逻辑回归参数,以及获取用户标签对所述资源的影响值,所述影响值用于描述所述用户标签对于所述资源处于点击类别的贡献;针对每一资源,根据所述逻辑回归参数以及用户标签对所述资源的影响值,对所述用户标签以及所对应资源特征运算所述用户对所述资源的点击率预测值。2.根据权利要求1所述的方法,其特征在于,所述针对每一资源,根据所述逻辑回归参数以及用户标签对所述资源的影响值,对所述用户标签以及所对应资源特征运算所述用户对所述资源的点击率预测值,包括:对每一资源通过逻辑回归参数进行所述用户标签以及所对应资源特征的逻辑回归运算,且在所述逻辑回归运算中新增用户标签对所述资源的影响值为附加项,获得所述用户对所述资源的点击率预测值。3.根据权利要求1所述的方法,其特征在于,所述针对每一资源,根据所述逻辑回归参数以及用户标签对所述资源的影响值,对所述用户标签以及所对应资源特征运算所述用户对所述资源的点击率预测值之后,所述方法还包括:根据向所述用户投放资源而为所述资源生成的用户行为日志获取所述资源对应的曝光和点击类别;以所述用户对应的用户标签以及所述资源对应的资源特征为样本数据,所述资源相对所述用户的曝光和点击类别为目标,根据所述用户对所述资源的点击预测值进行所对应逻辑回归参数的更新,获得更新的所述逻辑回归参数,且借助于所述逻辑回归参数的更新配合更新用户标签对所述资源的影响值。4.根据权利要求3所述的方法,其特征在于,所述借助于所述逻辑回归参数配合更新用户标签对所述资源的影响值,包括:引入所述样本数据对应的用户标签长度,借助所述逻辑回归运算中所述逻辑回归参数的更新,为用户标签对资源的影响值,配合更新所述样本数据对应的标签特征抽象项以及资源特征抽象项,所述标签特征抽象项是所述样本数据中用户标签的特征抽象,所述资源特征抽象项是所述样本数据中资源的特征抽象;进行所述标签特征抽象项和资源特征抽象项相互之间关联的平均化处理,获得用户标签对所述资源的影响值更新。5.根据权利要求4所述的方法,其特征在于,所述进行所述标签特征抽象项和资源特征抽象项相互之间关联的平均化处理,获得用户标签对所述资源的影响值更新之后,所述方法还包括:对样本数据所运算的点击率预测值相对于所述样本数据对应的曝光和点击类别偏差最小时,控制更新的所述影响值和逻辑回归参数被生效至所述资源的点击率预预估中。6.根据权利要求4所述的方法,其特征在于,所述引入所述样本数据对应的用户标签长度,借助所述逻辑回归运算中所述逻辑回归参数的更新,为用户标签对资源的影响值,配合更新所述样本数据对应的标签特征抽象项以及资源特征抽象项包括:在所述用户标签对资源的影响值更新中引入所述样本数据中用户标签对应的用户标签长度,借助于逻辑回归参数的更新方式对标签特征抽象项以及资源特征抽象项执行梯度计算获得分别描述用户标签和资源的每一元素更新,更新的所述元素分别形成更新的所述标签特征抽象项以及资源特征抽象项,所述标签特征抽象项以及资源特征抽象项...

【专利技术属性】
技术研发人员:尹程果周琦张小鹏
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1