【技术实现步骤摘要】
点击率预测方法、装置、电子设备及介质
本公开涉及大数据处理
,具体而言,涉及一种点击率预测方法、点击率预测装置、电子设备和计算机可读介质。
技术介绍
在线广告的出现使得传统的电视、报纸等广告行业向着直播、短视频等新兴互联网形式发展,因此积累了大量的行为数据,使得从数据中挖掘细致的用户兴趣成为可能。面对众多的用户和广告,如何将某个在线广告推送到合适的用户面前,以实现点击次数的最大化是在线广告需要研究的核心问题。广告点击率预估技术可以预测用户对广告可能点击的概率,一方面可以为用户推送感兴趣的广告,为用户减少搜索的时间;另一方面也可以为广告主提供有价值的参考信息,提高广告的效果。特征在广告预测中起着核心作用,输入特征通常是稀疏和高维的,由于使用原始特征很少能够获取最佳结果,有效的预测通常依赖于高阶组合特征,例如,年轻的职场女性会对化妆品类的广告更感兴趣,在校男生会对体育类广告更有兴趣等等。因此数据科学家会花费大量时间和精力对原始特征进行手工交互,以便获得最佳的预测结果。传统的手工特征的生成成本较大,需要数据科学家拥有 ...
【技术保护点】
1.一种点击率预测方法,其特征在于,包括:/n采集广告曝光数据作为样本数据,将所述广告曝光数据中包含的目标特征作为所述样本数据的标签;其中,所述广告曝光数据包括与广告对应的多个特征,所述目标特征为所述多个特征中的其中一个;所述标签用于表征所述广告是否被点击;/n对所述样本数据中的多个特征进行显式的特征交互,以获得显示交互特征,并对所述样本数据中的多个特征进行隐式的特征交互,以获得隐式交互特征;/n基于所述样本数据的标签,结合所述显式交互特征以及隐式交互特征获取点击率预测模型;其中,所述点击率预测模型用于预测待投放广告的点击率,所述点击率用于确定是否对所述待投放广告进行投放。/n
【技术特征摘要】
1.一种点击率预测方法,其特征在于,包括:
采集广告曝光数据作为样本数据,将所述广告曝光数据中包含的目标特征作为所述样本数据的标签;其中,所述广告曝光数据包括与广告对应的多个特征,所述目标特征为所述多个特征中的其中一个;所述标签用于表征所述广告是否被点击;
对所述样本数据中的多个特征进行显式的特征交互,以获得显示交互特征,并对所述样本数据中的多个特征进行隐式的特征交互,以获得隐式交互特征;
基于所述样本数据的标签,结合所述显式交互特征以及隐式交互特征获取点击率预测模型;其中,所述点击率预测模型用于预测待投放广告的点击率,所述点击率用于确定是否对所述待投放广告进行投放。
2.根据权利要求1所述的方法,其特征在于,所述对所述样本数据中的多个特征进行显式的特征交互,以获得显示交互特征,并对所述样本数据中的多个特征进行隐式的特征交互,以获得隐式交互特征包括:
生成所述样本数据多个特征域的嵌入向量;
对不同特征域的所述嵌入向量进行外积运算,获取显式交互特征;
对不同特征域的所述嵌入向量进行点积运算,获得隐式交互特征。
3.根据权利要求2所述的方法,其特征在于,所述嵌入向量包括第一嵌入向量以及第二嵌入向量;所述生成所述样本数据多个特征域的嵌入向量包括:
通过因子分解机生成所述样本数据多个特征域的第一嵌入向量;
通过场感知分解机获得所述样本数据多个特征域的第二嵌入向量。
4.根据权利要求1所述的方法,其特征在于,所述结合所述显式交互特征以及隐式交互特征获取点击率预测模型包括:
通过注意力机制确定所述显式交互特征的第一有效权重以及隐式交互特征的第二有效权重;
将所述显示交互特征、隐式交互特征以及所述第一有效权重和所述第二有效权重输入所述点击率预测模型的输出层,其中,所述输出层的取值范围为0到1。
5.根据权利要求2所述的方法,其特征在于,所述采集广告曝光数据作为样本数据之后,还包括:<...
【专利技术属性】
技术研发人员:练质彬,陈健生,
申请(专利权)人:广州博冠信息科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。