The embodiment of the application provides an advertisement click cheating monitoring method and device, which relates to the field of data processing. The methods include: based on M click data of advertisement, get all kinds of relevant data in M click data, M is positive integer; associate all kinds of relevant data in M click data according to the same dimension, combine them according to different dimension, get N feature data, N is positive integer; get the information gain rate of each feature data in N feature data; The Gauss model inputs n feature data with high information gain rate from N feature data to determine whether there are cheating clicks in M click data, and N is a positive integer not larger than N. It realizes the monitoring of click cheating and avoids the resource consumption caused by maintaining and updating the blacklist. When a new click cheating method appears, it can also be identified by analyzing the strong classification ability of the new click cheating, which greatly improves the security of anti-click cheating protection.
【技术实现步骤摘要】
广告点击作弊监测方法及装置
本申请涉及数据处理领域,具体而言,涉及一种广告点击作弊监测方法及装置。
技术介绍
随着移动设备的广泛应用,广告的市场也相应的迅速扩展。流量方在用户使用移动终端的过程中向其投放广告,通过用户的曝光、点击、下载安装、激活和购买等行为为广告主带来期望的转化,同时为自己谋利。于是,通过伪造流量的移动广告作弊应运而生。而依照目前主流的计费方式CPC(CostPerClick、每次点击计费),反作弊的手段主要以识别虚假点击为主。目前,广告点击的反作弊技术大多是以设置黑名单主。比如,通过建立黑名单,剔除所有来自匿名或代理IP,高风险或新的设备ID的点击,从访问的源头处过滤可疑流量。以及统计相同设备型号、UA或IP产生的点击过多或过于集中来识别点击作弊。但这种反作弊方法需要实时维护和更新黑名单,资源消耗大,且一旦出现新的点击作弊手段,原有的黑名单往往无法识别,从而任其造成巨大的损失。
技术实现思路
本申请在于提供一种广告点击作弊监测方法及装置,以有效改善上述的缺陷。为了实现上述目的,本申请的实施例通过如下方式实现:第一方面,本申请实施例提供了一种广告点击作弊监测方法,所述方法包括:基于广告的M条点击数据,获得所述M条点击数据中的各种相关数据,M为正整数;将所述M条点击数据中的各种相关数据按相同维度进行关联,按不同维度进行组合,统计计算得到N条特征数据,N为正整数;获得所述N条特征数据中每条特征数据的信息增益率,其中,每个信息增益率用于表示对应的每个特征数据分类能力的大小;调用预设的高斯模型输入所述N条特征数据中高信息增益率的n条特征数据,确定所述M ...
【技术保护点】
1.一种广告点击作弊监测方法,其特征在于,所述方法包括:基于广告的M条点击数据,获得所述M条点击数据中的各种相关数据,M为正整数;将所述M条点击数据中的各种相关数据按相同维度进行关联,按不同维度进行组合,统计计算得到N条特征数据,N为正整数;获得所述N条特征数据中每条特征数据的信息增益率,其中,每个信息增益率用于表示对应的每个特征数据分类能力的大小;调用预设的高斯模型输入所述N条特征数据中高信息增益率的n条特征数据,确定所述M条点击数据中是否有点击作弊,n为不大于N的正整数。
【技术特征摘要】
1.一种广告点击作弊监测方法,其特征在于,所述方法包括:基于广告的M条点击数据,获得所述M条点击数据中的各种相关数据,M为正整数;将所述M条点击数据中的各种相关数据按相同维度进行关联,按不同维度进行组合,统计计算得到N条特征数据,N为正整数;获得所述N条特征数据中每条特征数据的信息增益率,其中,每个信息增益率用于表示对应的每个特征数据分类能力的大小;调用预设的高斯模型输入所述N条特征数据中高信息增益率的n条特征数据,确定所述M条点击数据中是否有点击作弊,n为不大于N的正整数。2.根据权利要求1所述的广告点击作弊监测方法,其特征在于,所述获得所述N条特征数据中每条特征数据的信息增益率,包括:将所述N条特征数据中每条特征数据进行boxcox变换,获得每条特征数据的变换结果数据;基于每条特征数据的变换结果数据进行特征选择,获得每条特征数据的信息增益率。3.根据权利要求2所述的广告点击作弊监测方法。其特征在于,所述基于每条特征数据的变换结果数据进行特征选择,获得每条特征数据的信息增益率,包括:计算每条特征数据的变换结果数据的熵,以及计算每条特征数据的变换结果数据基于原始类标签的条件熵,其中,所述原始类标签作为一个点击数据是否为作弊点击的真实标记;根据每条特征数据的熵、所述条件熵和所述原始类标签的信息熵,获得每条特征数据的信息增益率。4.根据权利要求1-3任一权项所述的广告点击作弊监测方法,其特征在于,所述调用预设的高斯模型输入所述N条特征数据中高信息增益率的n条特征数据,确定所述M条点击数据中是否有点击作弊,包括:从所述N条特征数据中确定出高信息增益率的n条特征数据;调用预设的高斯模型计算所述n条特征数据中每条特征数据的概率密度,获得所述n条特征数据对应的概率密度乘积;根据所述概率密度乘积,确定所述M条点击数据中是否有点击作弊。5.根据权利要求4所述的广告点击作弊监测方法,其特征在于,根据所述概率密度乘积,确定所述M条点击数据中是否有点击作弊,包括:根据所述概率密度乘积,获得M条点击数据中每条点击数据在所述概率密度乘积中对应的概率密度乘积;根据每条点击数据的所述概率密度乘积中是否小于预设阈值,确定每条点击数据为是否为点击作弊,其中,每条点...
【专利技术属性】
技术研发人员:张舒虹,
申请(专利权)人:深圳市木瓜移动科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。