一种N+广告投放优化方法技术

技术编号:11728292 阅读:217 留言:0更新日期:2015-07-15 01:10
本发明专利技术提供一种N+广告投放优化方法,该方法将对目标客户浏览视频的标记值(即cookie)在未来一段时间(例如一周)内出现N次的概率做一个预测并得到预测值,设定一个概率阈值threhold,该预测值大于等于该阈值才对该cookie进行广告投放,小于则不投放。业内对该广告投放也称作播种,不投放则称作不播种。该方法能有效降低资源浪费,并能保证收益。

【技术实现步骤摘要】

本专利技术涉及一种N+广告投放优化方法
技术介绍
在广告商进行广告投放的活动中,有一类N+广告投放需求,即广告主要求投放的目标客户在一段时间内(例如为一周)能够有效地接触该广告至少是N次(通常为3次,由广告主根据自己的需求确定),如果在规定时间内某已经投放了该广告的目标客户达不到该次数要求,则视为一次无效的广告投放,如果达到该次数要求则视为一次有效的投放。除了对接触广告次数有要求外,对是否满足这样的目标客户的量也有一定要求。因此,对媒体广告平台而言,针对该类N+广告投放需求,如何确保对目标客户投放出去的广告的正确率和召回率成为关键问题,高正确率就能确保资源少浪费,高召回率则是量的保证,确保收益,在量并不充足的情况下应优先保证高召回率。
技术实现思路
为解决现有技术中存在的上述技术问题,本专利技术提供一种N+广告投放优化方法,该方法将对目标客户浏览视频的标记值(即cookie)在未来一段时间(例如一周)内出现N次的概率做一个预测并得到预测值,设定一个概率阈值threhold,该预测值大于等于该阈值才对该cookie进行广告投放,小于则不投放。业内对该广告投放也称作播种,不投放则称作不播种。该方法能有效降低资源浪费,并能保证收益。本专利技术的N+广告投放优化方法的基本原理是:在线下,首先对目标客户浏览视频的标记值(即cookie)的特征数据进行选择,选择对用户是否再回来具有表征作用而且线上能够轻易获取的特征数据,然后使用CART分类树来建立cookie是否再回来预测模型,通过该模型预测某cookie用户一周内是否还会再回来的概率;线上运行时,设定N值,设定概率阈值,通过线上获得该cookie的相应特征数据预测其再回来的概率,计算该概率的N次方结果,该结果大于等于设定概率阈值时投放广告,否则不投放。附图说明本专利技术将参照附图来进一步详细说明,其中:图1是本专利技术方法流程图;图2是本专利技术方法线上、线下实现的示意图。具体实施方式虽然将参照含有本专利技术的较佳实施例的附图充分描述本专利技术,但在此描述之前应了解本领域的普通技术人员可修改本文中所描述的专利技术,同时获得本发明的技术效果。因此,须了解以上的描述对本领域的普通技术人员而言为一广泛的揭示,且其内容不在于限制本专利技术所描述的示例性实施例。本专利技术的N+广告投放优化方法中使用CART(Classification and Regression Trees)分类树建立预测模型。首先,对本专利技术使用的CART分类树等背景做一个介绍。CART是决策树的一种,CART算法既可以用于创建分类树(Classification Tree),也可以用于创建回归树(Regression Tree),分类树是预测结果是离散类型值的树,回归树是预测结果为连续型值的树。决策树算法都属于有监督一类的机器学习算法,所以模型的建立需要经过有标签数据的训练过程,模型树建立过程中,难免会出现数据过度拟合的情况,因此树剪枝操作往往是必须的,剪枝包括预剪枝和后剪枝,预剪枝是在建树过程中进行的,后剪枝是建树完成后进行的。CART分类树的分支节点存储分割特征序号spInd和分割值spVal,叶子节点存储组合值包括:是否再来label,再来概率posProb,不来概率negProb,再来概率大于不来概率时,是否再来label为1,否则为0。再来概率由落在该叶子节点的分类标签值为1的数量除以该叶子中所有训练数据条数得出。训练、剪枝和测试数据集由cookie对应的特征属性和表示是否再来的0、1标签值组成。CART预剪枝:CART分类树在建立过程中会进行预剪枝,分为以下三种情况:如果在某个分支的所有数据中,某一类(标签为0或1)的数据所在比率大于等于某个阈值ratio_threshold时停止分支,作为叶子。该阈值作为参数传入,默认为0.85;如果在某个分支的所有数据条目数小于等于某个阈值num_threshold时停止分支,作为叶子。该阈值作为参数传入,默认为50;如果在某个分支属性分割后的基尼不纯度Gini相较于分割前的基尼不纯度并未降低到一定阈值gini_threshold时,停止分支,作为叶子。该阈值作为参数传入,默认为0.01。CART后剪枝:CART后剪枝是建立好模型分类树后在新的剪枝数据集上进行的,在以下两种情况中会进行后剪枝:如果某分支的左(或右)子树不是叶子,而没有数据分到该左(或右)子树,那么剪枝,该左(或右)子树变为叶子。叶子存储的值由兄弟分支的相关计算结果得出,把兄弟分支暂当作叶子计算其label,如果兄弟分支的label为1,则该叶子存储的值为[0,0.001,0.999],反之,存储[1,0.999,0.001];如果某分支的左右子树都是叶子,而计算出该分支在不分裂时的错误率要小于分裂后的错误率,那么剪枝,该分支变为叶子。计算所有落在该分支的数据中label为1的记录所占比,得出相应的值作为该叶子的存储值。下面,以一周为例说明本专利技术的N+广告投放优化方法,并不以此限定。本专利技术的N+广告投放优化方法包括:第一步,抽取目标客户浏览视频的标记值(即cookie)特征数据,生成CART分类树的训练、剪枝、测试数据。视频平台数据系统中通常有两个日志表,access表和vvlog表,分别用来记录视频广告的播放日志和vv日志,这两个日志表里有大量有关视频、广告、用户的相关属性信息,从这些属性里选择一部分属性信息来作为CART分类树的训练,剪枝和测试数据。选择的属性信息必须在线上也能轻易并快速的获取,以便做预测。生成CART分类树的训练、剪枝、测试数据的步骤如下:步骤1.1,以2014.08.04的数据为例,从access日志表中抽取2014.08.04这一天的cookie数据,记为:accessCookieAttrs_804,该数据集包含以下属性:cookie@sessionId,视频分类,是否为长视频,视频时长,时间戳,使用cookie@sessionId而不使用cookie是为了与vvlog中的数据一一映射。步骤1.2,从vvlog日志表中抽取2014.08.04这一天的cookie数据,记为:vvCookieAttrs_804,该数据集包含以下属性:cookie@sessionId,是否注册,vvstep史来vv,seidcount史来session计数,sevvstep本次session计数。步骤1本文档来自技高网...

【技术保护点】
一种N+广告投放优化方法,包括:第一步,抽取目标客户浏览视频的标记值(即cookie)特征数据,生成CART分类树的训练、剪枝、测试数据;第二步,建立CART分类树模型;第三步,抽取新的一段时间内的数据,进行N+广告投放预测与算法性能评估。

【技术特征摘要】
1.一种N+广告投放优化方法,包括:
第一步,抽取目标客户浏览视频的标记值(即cookie)特征数据,生成CART分类树的
训练、剪枝、测试数据;
第二步,建立CART分类树模型;
第三步,抽取新的一段时间内的数据,进行N+广告投放预测与算法性能评估。
2.如权利要求1所述的方法,其中第一步生成CART分类树的训练、剪枝、测试数据的
步骤进一步包括:
步骤1.1,从视频平台数据系统中记录视频广播播放日志的access日志表中抽取某一天
的cookie数据,记为:accessCookieAttrs_a;
步骤1.2,从视频平台数据系统中记录用户相关属性信息的vvlog日志表中抽取该天的
cookie数据,记为:vvCookieAttrs_a;
步骤1.3,统计access日志表中一定时间跨度内cookie出现的次数,记为:
cookieNum_b_c;
步骤1.4,整合连接上述三个步骤得到的三个数据集:accessCookieAttrs_a,
vvCookieAttrs_a,cookieNum_b_c,生成是否再来类属标签,得到新的数据集,记为:
trainOriginal_a_c;
步骤1.5,将步骤1.4得到的数据集trainOriginal_a_c进行抽样得到三份新的数据集,
分别为CART训练数据集...

【专利技术属性】
技术研发人员:雷龙艳章岑朱凯泉房晓宇江建博潘柏宇卢述奇
申请(专利权)人:合一信息技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1