一种点击率的预测方法、装置及电子设备制造方法及图纸

技术编号:23100200 阅读:27 留言:0更新日期:2020-01-14 20:48
本申请实施例提供一种点击率的预测方法、装置及电子设备。方法包括:提取待预测的目标推广项的基础特征;将目标推广项的基础特征输入至极端梯度提升xgboost模型,得到目标推广项的高阶特征;其中,xgboost模型是基于第一历史推广项的基础特征和第一历史推广项的标签训练得到的,第一历史推广项的标签指示第一历史推广项投放后的点击率;将目标推广项的高阶特征输入至预测模型,得到目标推广项的点击率;其中,预测模型是基于第二历史推广项的高阶特征和第二历史推广项的标签训练得到,第二历史推广项的标签指示第二历史推广项投放后的点击率,第二历史推广项的高阶特征与第一历史推广项的高阶特征具有相同的特征维度。

【技术实现步骤摘要】
一种点击率的预测方法、装置及电子设备
本申请实施例涉及数据处理
,尤其涉及一种点击率的预测方法、装置及电子设备。
技术介绍
随着网络技术的快速发展,互联网广告成为互联网企业最重要的盈利手段之一。研究表明,互联网广告的精准投放除了能够获得更好的广告效益外,还可以有效减少用户因未实现搜索预期,而向服务器发起的搜索请求的次数,从而降低服务器的压力。点击率(CTR,Click-Through-Rate)是反映互联网广告投放精准性的关键指标。如何实现点击率的预测,以为制定更合适的广告投放决策提供数据支持,是当前亟需解决的技术问题。
技术实现思路
本申请实施例目的是提供一种方法点击率的预测方法、装置及电子设备,能够实现点击率的预测,以为制定更合适的广告投放决策提供数据支持。为了实现上述目的,本申请实施例是这样实现的:第一方面,提供一种点击率的预测方法,包括:提取待预测的目标推广项的基础特征;将所述目标推广项的基础特征输入至极端梯度提升xgboost模型,得到所述目标推广项的高阶特征;其中,所述xgboost模型是基于第一历史推广项的基础特征和所述第一历史推广项的标签训练得到的,所述第一历史推广项的标签指示所述第一历史推广项投放后的点击率;将所述目标推广项的高阶特征输入至预测模型,得到所述目标推广项的点击率;其中,所述预测模型是基于第二历史推广项的高阶特征和所述第二历史推广项的标签训练得到,所述第二历史推广项的标签指示所述第二历史推广项投放后的点击率,所述第二历史推广项的高阶特征与所述第一历史推广项的高阶特征具有相同的特征维度。第二方面,提供一种点击率的预测装置,包括:基础特征提取模块,提取待预测的目标推广项的基础特征;高阶特征提取模块,将所述目标推广项的基础特征输入至极端梯度提升xgboost模型,得到所述目标推广项的高阶特征;其中,所述xgboost模型是基于第一历史推广项的基础特征和所述第一历史推广项的标签训练得到的,所述第一历史推广项的标签指示所述第一历史推广项投放后的点击率;点击率预测模块,将所述目标推广项的高阶特征输入至预测模型,得到所述目标推广项的点击率;其中,所述预测模型是基于第二历史推广项的高阶特征和所述第二历史推广项的标签训练得到,所述第二历史推广项的标签指示所述第二历史推广项投放后的点击率,所述第二历史推广项的高阶特征与所述第一历史推广项的高阶特征具有相同的特征维度。第三方面,提供一种电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行:提取待预测的目标推广项的基础特征;将所述目标推广项的基础特征输入至极端梯度提升xgboost模型,得到所述目标推广项的高阶特征;其中,所述xgboost模型是基于第一历史推广项的基础特征和所述第一历史推广项的标签训练得到的,所述第一历史推广项的标签指示所述第一历史推广项投放后的点击率;将所述目标推广项的高阶特征输入至预测模型,得到所述目标推广项的点击率;其中,所述预测模型是基于第二历史推广项的高阶特征和所述第二历史推广项的标签训练得到,所述第二历史推广项的标签指示所述第二历史推广项投放后的点击率,所述第二历史推广项的高阶特征与所述第一历史推广项的高阶特征具有相同的特征维度。第四方面,提供一种算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:提取待预测的目标推广项的基础特征;将所述目标推广项的基础特征输入至极端梯度提升xgboost模型,得到所述目标推广项的高阶特征;其中,所述xgboost模型是基于第一历史推广项的基础特征和所述第一历史推广项的标签训练得到的,所述第一历史推广项的标签指示所述第一历史推广项投放后的点击率;将所述目标推广项的高阶特征输入至预测模型,得到所述目标推广项的点击率;其中,所述预测模型是基于第二历史推广项的高阶特征和所述第二历史推广项的标签训练得到,所述第二历史推广项的标签指示所述第二历史推广项投放后的点击率,所述第二历史推广项的高阶特征与所述第一历史推广项的高阶特征具有相同的特征维度。本申请实施例的方案先提取推广项的基础特征,之后将基础特征输入至xgboost模型,利用xgboost模型多线程分裂、防过拟合以及在缺少特征值情况下自动学习分裂方向等特点,高效机械化生成推广项的高阶特征,避免了人为设定高阶特征的局限性。之后,将高阶特征输入至预测模型,由预测模型进一步以高阶特征作为参考因子,预测推广项的点击率,从而为制定更合适的推广项投放决策提供数据支持,可提高推广项的投放命中率,进而在一定程度上降低了用户因未实现搜索预期而向服务器发起的搜索请求的次数,减少了服务器的压力。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的点击率的预测方法的第一种流程示意图。图2为本申请实施例提供的点击率的预测装置的结构示意图。图3为本申请实施例提供的电子设备的结构示意图。具体实施方式为了使本
的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。如前所述,互联网广告的精准投放除了能够获得更好的广告效益外,还可以有效减少用户请求服务器的搜索次数,从而降低服务器的压力。点击率是反映互联网广告投放精准性的关键指标。为此,本申请旨在提供一种可以预测点击率的技术方案,能够为制定投放决策提供数据支持。图1是本申请实施例点击率的预测方法的流程图。图1所示的方法可以由下文相对应的装置执行,包括:步骤S102,提取待预测的目标推广项的基础特征。其中,目标推广项可以是不以营利为目的的广告,如政府公告,宗教、教育、文化、市政、社会团体等方面的启事、声明等,也可以是以营利为目的的广告或优惠券,这类是传播商品或服务信息的手段。具体地,在本步骤中可以对待预测的目标推广项进行结构化处理,得到目标推广项的结构化数据。之后,对目标推广项的结构化数据进行特征识别,得到目标推广项的基础特征。需要说明的是,特征识别的方法属于现有技术,由于本申请并不涉及该方面的改进,因此不再举例赘述。此外,本步骤还可以对提取到的至少两种基础特征进行组合,在原有基础特征的基础之上,生成新的基础特征。步骤S104,将目标推广项的基础特征输入至极端梯度提升xgb本文档来自技高网
...

【技术保护点】
1.一种点击率的预测方法,包括:/n提取待预测的目标推广项的基础特征;/n将所述目标推广项的基础特征输入至极端梯度提升xgboost模型,得到所述目标推广项的高阶特征;其中,所述xgboost模型是基于第一历史推广项的基础特征和所述第一历史推广项的标签训练得到的,所述第一历史推广项的标签指示所述第一历史推广项投放后的点击率;/n将所述目标推广项的高阶特征输入至预测模型,得到所述目标推广项的点击率;其中,所述预测模型是基于第二历史推广项的高阶特征和所述第二历史推广项的标签训练得到,所述第二历史推广项的标签指示所述第二历史推广项投放后的点击率,所述第二历史推广项的高阶特征与所述第一历史推广项的高阶特征具有相同的特征维度。/n

【技术特征摘要】
1.一种点击率的预测方法,包括:
提取待预测的目标推广项的基础特征;
将所述目标推广项的基础特征输入至极端梯度提升xgboost模型,得到所述目标推广项的高阶特征;其中,所述xgboost模型是基于第一历史推广项的基础特征和所述第一历史推广项的标签训练得到的,所述第一历史推广项的标签指示所述第一历史推广项投放后的点击率;
将所述目标推广项的高阶特征输入至预测模型,得到所述目标推广项的点击率;其中,所述预测模型是基于第二历史推广项的高阶特征和所述第二历史推广项的标签训练得到,所述第二历史推广项的标签指示所述第二历史推广项投放后的点击率,所述第二历史推广项的高阶特征与所述第一历史推广项的高阶特征具有相同的特征维度。


2.根据权利要求1所述的方法,
所述第一历史推广项对应的时间段早于所述第二历史推广项对应的时间段。


3.根据权利要求1所述的方法,
所述第二历史推广项的高阶特征是将所述第二历史推广项的基础特征输入至所述xgboost模型得到的。


4.根据权利要求1-3任一项所述的方法,
推广项的基础特征包括以下至少一种特征维度:
推广项的受众对象的画像特征、推广项的权益特征和推广项对应的历史点击率特征。


5.根据权利要求1-3任一项所述的方法,
所述目标推广项的点击率与所述目标推广项在投放平台的展示位置具有对应关系。


6.根据权利要求1-3任一项所述的方法,
所述预测模型包括深度神经网络模型。


7.根据权利要求1-3任一项所述的方法,
提取待预测的目标推广项的基础特征,包括:
对待预测的目标推广项进行结构化处理,得到所述目标推广项的结构化数据;
对所述目标推广项的结构化数据进行特征识别,得到所述目标推广项的基础特征。


8.一种点击率的预测装置,包括:
基础特征提取模块,提取待预测的目标推广项的基础特征;
高阶特征提取模块,将所述目标推广项的基础特征输入至极端梯度提升xgboost模型,得到所述目标推广项的高阶特征;其中,所述xgboost模型是基于第一历史推广项...

【专利技术属性】
技术研发人员:赵嘉祥
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1