具有最优阈值筛选的品牌广告效果优化的方法技术

技术编号:15041723 阅读:91 留言:0更新日期:2017-04-05 14:08
一种具有最优阈值筛选的品牌广告效果优化的方法及装置,所述方法充分利用了视频网站中被挖掘出的大量用户信息,包括人口基础信息和偏好,还能够结合素材本身的行业描述,对这些数据整合、清洗;再进行特征抽取与格式化,获取用于模型训练的特征;通过得到特征数据进行模型训练得到训练模型,利用不同时间段的验证数据通过训练模型分别得到不同的点击率,比较优选后得到点击率阈值。利用随后的测试数据经过与点击率阈值的比较进行广告投放判断。经过实践证明,本发明专利技术提高了对新广告投放的各项指标均有大幅提高,更精准地向用户投放广告,提高点击率。

【技术实现步骤摘要】

本申请涉及广告投放领域,具体的,涉及一种利用广告的以往投放数据建立投放模型,对最优阈值筛选的品牌广告效果优化的方法。
技术介绍
品牌广告主在进行广告投放往往希望投放的广告达到一定的展现量,以展现他们的产品,在这个基础上,广告主希望自己的广告在一定展现量的前提下能获取更多的点击率。要想获取高的广告点击率,除了跟广告本身品质、吸引度相关之外,还与用户是个人的需求及喜好相关,而根据用户需求及喜好向用户投放其喜好的视频广告能够提高广告的点击率。视频网站是指在完善的技术平台支持下,让互联网用户在线流畅发布、浏览和分享视频作品的网络媒体。由此,视频网站没有像搜索引擎那样获取用户直接需求信息的功能,现阶段的广告点击率预算模型选择不当又导致不能准确地向用户精准地投放视频广告。因此,如何向用户投放更准确的广告并且提高广告点击率,进一步的,如何建立更加优化的广告点击率预算模型对广告投放进行预测以向用户精确地投放广告成为现有技术亟待解决的问题。
技术实现思路
本专利技术的目的在于提出一种广告投放的预测算法,对视频网站中被挖掘出来的大量用户信息,包括用户基本信息及用户偏好,进行整合处理,结合广告素材本身的特点,通过模型预测及验证最优广告点击率,再进行广告投放点击率优化工作,更精准地向用户投放广告,提高点击率。为达此目的,本专利技术采用以下技术方案:一种具有最优阈值筛选的品牌广告效果优化的方法包括如下步骤:数据源清洗及整合步骤S110:获得四种数据作为点击率优化模型的数据源,所述四种数据包括:用户信息数据:指的是用户在视频网站内观看和/或点击广告的行为得到的用户关注行业偏好信息以及视频网站偏好信息,素材信息数据:指的是品牌广告的素材信息,广告展示日志信息:指的是广告展示时记录下的相关信息,广告点击日志信息:用户点击广告时记录下的相关信息,将上述四种数据进行数据的整合与清洗,得到用户的人口属性和偏好信息;特征提取及格式化步骤S120:对清洗及整合后的数据进行特征提取与格式化,将格式化后的数据按照一定的比例进行分配得到模型训练数据和第一验证数据;模型训练及验证步骤S130:使用模型训练数据利用模型算法进行模型训练得到训练模型,使用第一验证数据在所述训练模型中进行验证,选定最优点击率作为预测的第一点击率,使用在模型训练数据之后的广告投放的所述四种数据,利用特征提取及格式化步骤的方法得到第二验证数据,使用所述第二验证数据在所述训练模型中进行验证,选定最优点击率作为预测的第二点击率,将第一点击率与第二点击率进行线性比较,最高值作为预测的点击率阈值;模型测试及投放步骤S140:利用第二验证数据之后的广告投放的所述四种数据,利用特征提取及格式化步骤的方法得到模型测试数据,将所述模型测试数据输入到所述训练模型中获得的点击率值与所述点击率阈值比较,大于等于所述点击率阈值则进行投放,小于点击率阈值则不投放。优选地,在数据源清洗及整合步骤中,所述将上述四种数据进行数据的整合与清洗,包括通过验证去除不需要的属性,或者对一些缺失的数据进行补充,整合。优选地,在特征提取及格式化步骤中,所述特征提取进一步包括抽取三方面不同的特征,包括:上下文信息特征,即发生当前广告行为时的上下文环境信息;广告信息特征,即广告素材的描述信息;用户信息特征,即当前用户的基础信息与偏好信息。优选地,在特征提取及格式化步骤中,所述格式化包括将上述三种特征分两类不同类别的特征:类别特征与连续特征,分别进行处理,变成适合算法训练的数据格式。优选地,在所述模型训练及验证步骤中:所述模型算法为逻辑回归模型算法(LogisticRegression)或梯度增强决策树算法(GradientBoostingDecisionTree,简称GBDT),或者两者的结合,得到所述训练模型。本专利技术还公开了一种具有最优阈值筛选的品牌广告效果优化的装置,包括如下单元:数据源清洗及整合单元S210:获得四种数据作为点击率优化模型的数据源,所述四种数据包括:用户信息数据:指的是用户在视频网站内观看和/或点击广告的行为得到的用户关注行业偏好信息以及视频网站偏好信息,素材信息数据:指的是品牌广告的素材信息,广告展示日志信息:指的是广告展示时记录下的相关信息,广告点击日志信息:用户点击广告时记录下的相关信息,将上述四种数据进行数据的整合与清洗,得到用户的人口属性和偏好信息;特征提取及格式化单元S220:对清洗及整合后的数据进行特征提取与格式化,将格式化后的数据按照一定的比例进行分配得到模型训练数据和第一验证数据;模型训练及验证单元S230:使用模型训练数据利用模型算法进行模型训练得到训练模型,使用第一验证数据在所述训练模型中进行验证,选定最优点击率作为预测的第一点击率,使用在模型训练数据之后的广告投放的所述四种数据,利用特征提取及格式化单元得到第二验证数据,使用所述第二验证数据在所述训练模型中进行验证,选定最优点击率作为预测的第二点击率,将第一点击率与第二点击率进行线性比较,最高值作为预测的点击率阈值;模型测试及投放单元S240:利用第二验证数据之后的广告投放的所述四种数据,利用特征提取及格式化单元得到模型测试数据,将所述模型测试数据输入到所述训练模型中获得的点击率值与所述点击率阈值比较,大于等于所述点击率阈值则进行投放,小于点击率阈值则不投放。优选地,在数据源清洗及整合单元中,所述将上述四种数据进行数据的整合与清洗,包括通过验证去除不需要的属性,或者对一些缺失的数据进行补充,整合。优选地,在特征提取及格式化单元中,所述特征提取进一步包括抽取三方面不同的特征,包括:上下文信息特征,即发生当前广告行为时的上下文环境信息;广告信息特征,即广告素材的描述信息;用户信息特征,即当前用户的基础信息与偏好信息。优选地,在特征提取及格式化单元中,所述格式化包括将上述三种特征分两类不同类别的特征:类别特征与连续特征,分别进行处理,变成适合算法训练的数据格式。优选地,在所述模型训练及验证单元中:所述模型算法为逻辑回归模型算法(LogisticRegression)或梯度增强决策树算法(GradientBoostingDecisionTree,简称GBDT),或者两者的结本文档来自技高网...
具有最优阈值筛选的品牌广告效果优化的方法

【技术保护点】
一种具有最优阈值筛选的品牌广告效果优化的方法,包括如下步骤:数据源清洗及整合步骤(S110):获得四种数据作为点击率优化模型的数据源,所述四种数据包括:用户信息数据:指的是用户在视频网站内观看和/或点击广告的行为得到的用户关注行业偏好信息以及视频网站偏好信息,素材信息数据:指的是品牌广告的素材信息,广告展示日志信息:指的是广告展示时记录下的相关信息,广告点击日志信息:用户点击广告时记录下的相关信息,将上述四种数据进行数据的整合与清洗,得到用户的人口属性和偏好信息;特征提取及格式化步骤(S120):对清洗及整合后的数据进行特征提取与格式化,将格式化后的数据按照一定的比例进行分配得到模型训练数据和第一验证数据;模型训练及验证步骤(S130):使用模型训练数据利用模型算法进行模型训练得到训练模型,使用第一验证数据在所述训练模型中进行验证,选定最优点击率作为预测的第一点击率,使用在模型训练数据之后的广告投放的所述四种数据,利用特征提取及格式化步骤的方法得到第二验证数据,使用所述第二验证数据在所述训练模型中进行验证,选定最优点击率作为预测的第二点击率,将第一点击率与第二点击率进行线性比较,最高值作为预测的点击率阈值;模型测试及投放步骤(S140):利用第二验证数据之后的广告投放的所述四种数据,利用特征提取及格式化步骤的方法得到模型测试数据,将所述模型测试数据输入到所述训练模型中获得的点击率值与所述点击率阈值比较,大于等于所述点击率阈值则进行投放,小于点击率阈值则不投放。...

【技术特征摘要】
1.一种具有最优阈值筛选的品牌广告效果优化的方法,包括如下
步骤:
数据源清洗及整合步骤(S110):获得四种数据作为点击率优化
模型的数据源,所述四种数据包括:
用户信息数据:指的是用户在视频网站内观看和/或点击广告的
行为得到的用户关注行业偏好信息以及视频网站偏好信息,
素材信息数据:指的是品牌广告的素材信息,
广告展示日志信息:指的是广告展示时记录下的相关信息,
广告点击日志信息:用户点击广告时记录下的相关信息,
将上述四种数据进行数据的整合与清洗,得到用户的人口属性和
偏好信息;
特征提取及格式化步骤(S120):对清洗及整合后的数据进行特
征提取与格式化,将格式化后的数据按照一定的比例进行分配得到模
型训练数据和第一验证数据;
模型训练及验证步骤(S130):使用模型训练数据利用模型算法
进行模型训练得到训练模型,使用第一验证数据在所述训练模型中进
行验证,选定最优点击率作为预测的第一点击率,
使用在模型训练数据之后的广告投放的所述四种数据,利用特征
提取及格式化步骤的方法得到第二验证数据,使用所述第二验证数据
在所述训练模型中进行验证,选定最优点击率作为预测的第二点击
率,将第一点击率与第二点击率进行线性比较,最高值作为预测的点
击率阈值;
模型测试及投放步骤(S140):利用第二验证数据之后的广告投
放的所述四种数据,利用特征提取及格式化步骤的方法得到模型测试
数据,将所述模型测试数据输入到所述训练模型中获得的点击率值与
所述点击率阈值比较,大于等于所述点击率阈值则进行投放,小于点

\t击率阈值则不投放。
2.根据权利要求1所述的具有最优阈值筛选的品牌广告效果优
化的方法,其特征在于:
在数据源清洗及整合步骤中,所述将上述四种数据进行数据的整
合与清洗,包括通过验证去除不需要的属性,或者对一些缺失的数据
进行补充,整合。
3.根据权利要求1所述的具有最优阈值筛选的品牌广告效果优
化的方法,其特征在于:
在特征提取及格式化步骤中,所述特征提取进一步包括抽取三方
面不同的特征,包括:
上下文信息特征,即发生当前广告行为时的上下文环境信息;
广告信息特征,即广告素材的描述信息;
用户信息特征,即当前用户的基础信息与偏好信息。
4.根据权利要求3所述的具有最优阈值筛选的品牌广告效果优
化的方法,其特征在于:
在特征提取及格式化步骤中,所述格式化包括将上述三种特征分
两类不同类别的特征:类别特征与连续特征,分别进行处理,变成适
合算法训练的数据格式。
5.根据权利要求1-4中任意一项所述的具有最优阈值筛选的品
牌广告效果优化的方法,其特征在于:
在所述模型训练及验证步骤中:所述模型算法为逻辑回归模型算
法(LogisticRegression)或梯度增强决策树算法(Gradient
BoostingDecisionTree,简称GBDT),或者两者的结合,得到所述
训练模型。<...

【专利技术属性】
技术研发人员:杨田雷龙艳章岑周盛潘柏宇王冀
申请(专利权)人:合一网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1