一种预测广告点击率的方法和装置制造方法及图纸

技术编号：11328666 阅读：60 留言：0更新日期：2015-04-22 19:18

本发明专利技术公开了一种预测广告点击率的方法和装置，包括：步骤1)获取历史数据样本作为训练数据；利用随机森林方法选择出最有价值的特征，并排除掉无关或者相关性较小的特征；步骤2)利用回归模型对上述得到的去除无关或者相关性较小的特征后的训练数据进行广告点击率的预测。本发明专利技术采取了上述方案以后，能够利用的数据的范围大大提高,通过去除无关或者相关性较小的特征后,能够提高数据的利用效率；对于数据的缺失的问题,该方法对数据的缺失不敏感,部分数据的缺失,该方法也能得到较好的效果；对于无关特征的问题,该方法能够自动的确定出数据中的无关特征,从而能够到更加精确的广告点击率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于大数据计算领域，尤其涉及一种预测广告点击率的方法和装置。
技术介绍
目前在广告点击率预估的过程中普遍运用了逻辑回归的方法来计算其点击率预估值，但是，由于在广告点击率预估的方法中使用的是逻辑回归的方法，而这种方法对数据的依赖性较大，如果数据呈现出线性的关系，则使用逻辑回归的方法预估广告点击率能得到较好的效果，然而，对于非线性的数据，则该方法的效果就明显较差，目前在广告点击率预估的相关方法中，将非线性的数据进行线性转变则大都是利用特征离散化并同时进行0-1编码的方法，然而并没有对原始特征进行特征提取，排除无关特征，这种方法会造成以下的缺点：1.数据的特征会成倍的增加，大量的无关的特征会出现，影响后续进行广告点击率预估时的精度2.数据的特征增加，会导致一个很严重的问题，即占用大量的内存3.整个过程并没有对无关特征进行选择，而且该方法的效果对数据的缺失很敏感，部分数据的丢失会对利用逻辑回归的方法进行广告点击率预估的效果造成很大的影响。
技术实现思路
本方法是提出了一个思想及其具体的算法过程并用公式来表达.可以对现有的广告点击率预估的方法进行更准备的处理，以得到更加有效的广告点击率预估值。本专利技术解决上述技术问题所采取的技术方案如下： -种预测广告点击率的方法，包括：步骤1)获取历史数据样本作为训练数据；利用随机森林方法选择出最有价值的特征，并排除掉无关或者相关性较小的特征；步骤2)利用回归模型对上述得到的去除无关或者相关性较小的特征后的训练数据进行广告点击率的预测。进一步地，步骤1)中，获取历史数据...

【技术保护点】
一种预测广告点击率的方法，其特征在于，包括：步骤1)获取历史数据样本作为训练数据；利用随机森林方法选择出最有价值的特征，并排除掉无关或者相关性较小的特征；步骤2)利用回归模型对上述得到的去除无关或者相关性较小的特征后的训练数据进行广告点击率的预测。

【技术特征摘要】

【专利技术属性】
技术研发人员：王玮，
申请(专利权)人：北京掌阔技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人