一种预估网络广告效果的方法,该方法包括:将原始数据依据广告效果影响因子进行分类;从广告效果影响因子中提取广告效果影响子因子;依据广告效果影响子因子,采用回归分析和重抽样算法Bagging建立不少于一个预估模型;由十折交叉验证方法从预估模型中选择出最佳预估模型;利用最佳预估模型对下一预测周期内的广告效果进行预估,得到广告预估效果。本文还公开了一种预估网络广告效果的系统。应用本发明专利技术实施例以后,可以对广告投放效果做出高精度预测且预估结果是多样化的。
【技术实现步骤摘要】
本专利技术涉及网络
,更具体地,涉及一种预估网络广告效果的方法及系统。
技术介绍
网络广告称为在线广告或者互联网广告,是以计算机为核心,计算机网络为媒介 的广告行为。网络广告效果预估结果的高低,与该网络广告的直接收益有着密切的联系。现 有广告效果预估方法是一种以经验为主的预估方法,即根据广告位在前一个预测周期内的 实际效果数据,取其平均值作为下一个预测周期的预估结果。比如在11月底,想要预估12月份的某一广告位的曝光数。曝光数是统计周期内, 用户浏览网站页面的总次数,重复访问则重复统计。以经验为主的预估方法是将11月份的 该广告位每天的曝光数相加,然后求平均作为12月份该广告位曝光的预估效果。实际上就 是利用广告位近期的效果估算下一个周期的效果。然而,影响广告投放效果的因素有很多,在不同周期内影响因素是不一样的,仅仅 根据广告位在前一预测周期内的实际效果数据无法对下一周期内的效果做出准确的预估。 另外,以经验为主的预估方法对同一广告位上的不同广告,得到的是单一的预估结果,无法 根据不同的投放条件做出不同的效果预估。
技术实现思路
本专利技术实施例提出一种预估网络广告效果的方法,可以对广告投放效果做出高精 度预测且预估结果是多样化的。本专利技术实施例还提出一种预估网络广告效果的系统,可以对广告投放效果做出高 精度预测且预估结果是多样化的。本专利技术实施例的技术方案如下一种预估网络广告效果的方法,该方法包括将原始数据依据广告效果影响因子进行分类;从广告效果影响因子中提取广告效果影响子因子;依据广告效果影响子因子,采用回归分析和重抽样算法Bagging建立至少于一个 预估模型;由交叉验证方法从预估模型中选择出最佳预估模型;利用最佳预估模型对下一预测周期内的广告效果进行预估,得到广告预估效果。所述交叉验证算法是十折交叉验证算法。所述广告效果影响因子包括广告位属性、广告属性、日期因子、广告主属性、用户 属性、历史效果数据属性、突发事件和偶然因子。所述回归分析方法包括保序回归IsotonicRegression、回归剪枝树REPTree和局 部力口权回归 Locally weighted learning。所述将原始数据依据广告效果影响因子进行分类与所述从广告效果影响因子提取广告效果影响子因子之间进一步包括,对分类后的原始数据进行预处理。所述预处理包括利用预估广告位上一周期内的效果数据的平均值替代缺失或错 误数据。所述预处理包括对数据进行平滑处理,得到缺失或错误数据。所述得到广告预估效果后进一步包括,根据广告预估效果安排不同广告的投放时 间。所述得到广告预估效果后进一步包括,根据广告预估效果和实际效果发现原始数 据的错误,对原始数据进行校正。一种预估网络广告效果的系统,该系统包括数据模块,将原始数据依据广告效果影响因子进行分类。特征模块,从广告效果影响因子中提取广告效果影响子因子。模型模块,依据广告效果影响子因子,采用回归分析和重抽样算法Bagging建立 至少一个预估模型,由交叉验证方法从预估模型中选择出最佳预估模型,利用最佳预估模 型对下一预测周期内的广告效果进行预估,得到广告预估效果。所述模型模块由十折交叉验证方法从预估模型中选择出最佳预估模型。所述系统进一步包括预处理模块,对分类后的原始数据进行预处理。所述预处理模块包括替代单元,利用预估广告位上一周期内的效果数据的平均值 替代缺省或错误数据。所述预处理模块包括平滑处理单元,对数据进行平滑处理,得到缺失或错误数据。所述系统进一步包括分析模块,对预处理后的广告效果因子进行分析,为广告产 品的设计,广告创意的设计提供支持;排期模块,根据广告预估效果安排不同广告的投放时间;监控模块,根据广告预估效果和实际效果发现原始数据的错误,对原始数据进行 校正。从上述技术方案中可以看出,在本专利技术实施例中,将原始数据依据广告效果影响 因子进行分类;从广告效果影响因子中提取广告效果影响子因子;依据广告效果影响子因 子,采用回归分析和重抽样算法Bagging建立不少于一个预估模型;由十折交叉验证方法 从预估模型中选择出最佳预估模型;利用最佳预估模型对下一预测周期内的广告效果进行 预估,得到广告预估效果。由不同的广告效果影响因子建模可以对广告投放效果做出高精 度预测,且输入不同的广告效果影响因子有不同的预估结果。附图说明图1为本专利技术实施例一种预估网络广告效果的方法中模型选择示意图;图2为本专利技术实施例中广告效果影响因子的分类示意图;图3为本专利技术实施例一种预估网络广告效果的方法流程示意图;图4为本专利技术实施例一种预估网络广告效果的结构示意图。具体实施例方式为使本专利技术的目的、技术方案和优点表达得更加清楚明白,下面结合附图及具体实施例对本专利技术再作进一步详细的说明。在本专利技术实施例中,通过分析不同广告效果影响因子与广告效果之间的相关性, 提取出相关性大的影响因子作为预估模型的建模字段,采用回归分析的方法建立广告效果 预估模型,对广告的曝光量和点击量进行有效预测。从而提高广告效果的预估精度,并针对 不同的投放条件自动产生不同的预估效果。参见附图1,广告效果预估模型的构建共采用了三种回归分析方法,分别是保序回 归(IsotonicRegression)、回归剪枝树(REPTree)以及局部加权回归(Locally weighted learning) 0具体模型的训练采用了重抽样算法(Bagging)的方法,即针对某一学习算法, 让该学习算法训练多轮,每轮的训练数据由从初始的训练数据集中随机采样组成,每次采 样固定比例的样本,训练之后得到一个预估函数序列,最终的预估函数采用简单平均方法 对示例进行预测。同时,本专利技术中利用十折交叉验证方法对模型的参数进行选择,最后从所 有的模型中选择出一个最优的模型作为最佳预估模型。当然也可以利用多种交叉验证方法 对模型的参数进行选择,例如,九折交叉验证方法,八折交叉验证方法等。如图2所示,在本专利技术中广告效果影响因子包括,广告位属性、广告属性、日期因 子、广告主属性、用户属性、历史效果数据属性、突发事件和偶然因子。每个广告效果影响因 子又包括多个广告效果影响子因子。广告位属性包括,广告位大小、广告位资源级别、广告位所属频道及频道的曝光数 据、广告位分类、广告位的轮播数、广告位位置。广告属性包括,广告播放类型、广告轮播数、广告的播出时间、是否弹出广告、广告 创意属性(代言明星数、主色系、有无奖品吸引、互动、创意格式、清晰度、价格/促销/奖 品、产品卖点/品牌特性、创意大小)。日期相关因子包括,是否工作日、是否农历节假日、是否阳历节假日、是否西方节 日、季节性因子。广告主属性包括,广告主所属行业、广告主在行业中的排名。用户属性包括,年龄、性别、地理、上网场景、时段、行为。历史效果数据属性包括,前η天的历史效果数据、周同期历史数据、月同期历史数 据。突发事件和偶然因子包括,网站及页面改版、重大社会事件(如高考、两会等)。参见附图3,是本专利技术实施例一种预估网络广告效果的方法流程示意图,该方法具 体包括以下步骤步骤301、对所有收集到的数据按照广告效果影响因子分类。将数据按照广告位属 性、广告属性、日期因子、广告主属性、用户属性、历史效果数据属性、突发事件和偶然因子 分类。本文档来自技高网...
【技术保护点】
1.一种预估网络广告效果的方法,其特征在于,该方法包括:将原始数据依据广告效果影响因子进行分类;从广告效果影响因子中提取广告效果影响子因子;依据广告效果影响子因子,采用回归分析和重抽样算法Bagging建立至少一个预估模型;由交叉验证方法从预估模型中选择出最佳预估模型;利用最佳预估模型对下一预测周期内的广告效果进行预估,得到广告预估效果。
【技术特征摘要】
【专利技术属性】
技术研发人员:言艳花,肖磊,李多全,岳亚丁,陈永锋,叶幸春,赖晓平,刘大鹏,黄华基,李邕,贡鸣,陈显露,
申请(专利权)人:深圳市腾讯计算机系统有限公司,
类型:发明
国别省市:94[中国|深圳]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。