This application provides a click-through rate prediction method based on Xgboost algorithm, which includes: selecting a predetermined number of original features from the log data of the advertising platform; training the Xgboost algorithm with various original features to obtain model files; obtaining the current features corresponding to the predetermined number of advertisements in the advertising Library of the advertising platform; and separating the current features from each other. The click-through rate is calculated with the model file, and the corresponding predicted click-through rate is obtained. It can be seen that this method is based on the Xgboost algorithm to get the corresponding model file, which can quickly process the advertising features to get the predicted click-through rate value. In addition, this method can be implemented on various platforms with good portability, and is more fault-tolerant than related technologies. The application also provides a click-through rate prediction system based on Xgboost algorithm, computer and computer readable storage media, all of which have the above beneficial effects.
【技术实现步骤摘要】
一种基于Xgboost算法的点击率预估方法及系统
本申请涉及点击率预估领域,特别涉及一种基于Xgboost算法的点击率预估方法、系统、计算机及计算机可读存储介质。
技术介绍
随着网络技术的快速发展,互联网广告成为互联网企业最重要的盈利手段之一。像Google、Facebook、百度等公司的互联网变现和收入的主要来源也是广告。近些年,越来越多的企业和机构开始研究互联网广告平台,他们也慢慢地将传统媒体广告(报纸、杂志、电视、广播等)投放转向互联网广告投放。然而,互联网广告投放的随意性和泛滥性让网民深受其烦,不仅收益不理想,而且点击率(Click-Through-Rate,CTR)也在下降。例如,南药资源平台是以中药材价格信息、药材产地信息、中药材市场行情、种植技术等信息服务为主并结合实体中药材交易市场的第三方网络服务平台。该平台上每年新投放的广告越来越多,但由于广告投放策略不适当,使得点击率不能有所提升,也导致展示这些广告带来的收益一直达不到预期效果。事实上,这里投放策略不佳的原因主要有两点:1)页面所展示的广告与用户感兴趣的信息相关性不大;2)广告投放的目的是将点击率高的广告投放到好的位置来最大限度获取用户的点击,由于该平台在投放广告前没有对每条候选广告做精确的CTR预估,只能凭借经验来摆放广告的位置,这很可能将点击率高的广告放在不显眼的位置。那么,制定怎样的广告投放策略才能实现广告精准投放,这需要从用户信息、页面信息、广告信息中抽取出有用特征(如用户ip、查询请求的时间戳、广告id、广告标题、广告描述、匹配的竞价词、广告标题的切词结果、广告描述的切词结果、 ...
【技术保护点】
1.一种基于Xgboost算法的点击率预估方法,其特征在于,包括:从广告投放平台的日志数据中选取出预定数量的原始特征;利用各个所述原始特征对Xgboost算法进行模型训练,得到模型文件;获取所述广告投放平台的广告库中预定数量广告对应的当前特征;将各个所述当前特征分别和所述模型文件进行点击率的计算,得到对应的预估点击率数值。
【技术特征摘要】
1.一种基于Xgboost算法的点击率预估方法,其特征在于,包括:从广告投放平台的日志数据中选取出预定数量的原始特征;利用各个所述原始特征对Xgboost算法进行模型训练,得到模型文件;获取所述广告投放平台的广告库中预定数量广告对应的当前特征;将各个所述当前特征分别和所述模型文件进行点击率的计算,得到对应的预估点击率数值。2.根据权利要求1所述的广告点击率预估方法,其特征在于,得到对应的预估点击率数值之后,还包括:根据各个所述预估点击率数值的大小,对各个所述预估点击率数值对应的广告进行排序;根据所述排序确定各个所述广告在所述广告投放平台的摆放位置。3.根据权利要求1所述的广告点击率预估方法,其特征在于,从广告投放平台的日志数据中选取出预定数量的原始特征和利用各个所述原始特征对Xgboost算法进行模型训练,得到模型文件之间,还包括:对多个所述原始特征进行组合。4.根据权利要求1所述的广告点击率预估方法,其特征在于,得到对应的预估点击率数值之后,还包括:获取所述预估点击率数值对应的广告的实际点击率数值;利用所述预估点击率数值及对应的所述实际点击率数值和logloss评估算法进行评估计算,得出评估结果。5.一种基于Xgboost算法的点击率预估系统,其特征在于,包括:原始特征选取模块,用于从广告投放平台的日志数据中选取出预定数量的原始特征;模型训练模块,用于利用各个所述原始特征对Xgboost算法进行模型训练,得到模型文件;当...
【专利技术属性】
技术研发人员:曾虎,冯广,徐启东,周瀚章,龚旭辉,
申请(专利权)人:广东工业大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。