广告点击作弊监测方法及装置制造方法及图纸

技术编号:20004146 阅读:29 留言:0更新日期:2019-01-05 17:17
本申请实施例提供了一种广告点击作弊监测方法及装置,涉及数据处理领域。方法包括:基于广告的M条点击数据,获得M条点击数据中的各种相关数据,M为正整数;将M条点击数据中的各种相关数据按相同维度进行关联,按不同维度进行组合,统计计算得到N条特征数据,N为正整数;获得N条特征数据中每条特征数据的信息增益率;调用预设的高斯模型输入N条特征数据中高信息增益率的n条特征数据,确定M条点击数据中是否有作弊点击的点击数据,n为不大于N的正整数。实现对点击作弊进行监测,避免了因维护和更新黑名单所造成的资源耗费。在出现新的点击作弊手段时,利用分析该新的点击作弊中分类能力强的特征也可以对其进行识别,极大的提高反点击作弊防护的安全性。

Monitoring Method and Device of Click Cheating in Advertising

The embodiment of the application provides an advertisement click cheating monitoring method and device, which relates to the field of data processing. The methods include: based on M click data of advertisement, get all kinds of relevant data in M click data, M is positive integer; associate all kinds of relevant data in M click data according to the same dimension, combine them according to different dimension, get N feature data, N is positive integer; get the information gain rate of each feature data in N feature data; The Gauss model inputs n feature data with high information gain rate from N feature data to determine whether there are cheating clicks in M click data, and N is a positive integer not larger than N. It realizes the monitoring of click cheating and avoids the resource consumption caused by maintaining and updating the blacklist. When a new click cheating method appears, it can also be identified by analyzing the strong classification ability of the new click cheating, which greatly improves the security of anti-click cheating protection.

【技术实现步骤摘要】
广告点击作弊监测方法及装置
本申请涉及数据处理领域,具体而言,涉及一种广告点击作弊监测方法及装置。
技术介绍
随着移动设备的广泛应用,广告的市场也相应的迅速扩展。流量方在用户使用移动终端的过程中向其投放广告,通过用户的曝光、点击、下载安装、激活和购买等行为为广告主带来期望的转化,同时为自己谋利。于是,通过伪造流量的移动广告作弊应运而生。而依照目前主流的计费方式CPC(CostPerClick、每次点击计费),反作弊的手段主要以识别虚假点击为主。目前,广告点击的反作弊技术大多是以设置黑名单主。比如,通过建立黑名单,剔除所有来自匿名或代理IP,高风险或新的设备ID的点击,从访问的源头处过滤可疑流量。以及统计相同设备型号、UA或IP产生的点击过多或过于集中来识别点击作弊。但这种反作弊方法需要实时维护和更新黑名单,资源消耗大,且一旦出现新的点击作弊手段,原有的黑名单往往无法识别,从而任其造成巨大的损失。
技术实现思路
本申请在于提供一种广告点击作弊监测方法及装置,以有效改善上述的缺陷。为了实现上述目的,本申请的实施例通过如下方式实现:第一方面,本申请实施例提供了一种广告点击作弊监测方法,所述方法包括:基于广告的M条点击数据,获得所述M条点击数据中的各种相关数据,M为正整数;将所述M条点击数据中的各种相关数据按相同维度进行关联,按不同维度进行组合,统计计算得到N条特征数据,N为正整数;获得所述N条特征数据中每条特征数据的信息增益率,其中,每个信息增益率用于表示对应的每个特征数据分类能力的大小;调用预设的高斯模型输入所述N条特征数据中高信息增益率的n条特征数据,确定所述M条点击数据中是否有点击作弊,n为不大于N的正整数。结合第一方面,在一些可能的实现方式中,所述获得所述N条特征数据中每条特征数据的信息增益率,包括:将所述N条特征数据中每条特征数据进行boxcox变换,获得每条特征数据的变换结果数据;基于每条特征数据的变换结果数据进行信息增益率计算,获得每条特征数据的信息增益率。结合第一方面,在一些可能的实现方式中,所述基于每条特征数据的变换结果数据进行特征选择,获得每条特征数据的信息增益率,包括:计算每条特征数据的变换结果数据的熵,以及计算每条特征数据的变换结果数据基于原始类标签的条件熵,其中,所述原始类标签作为一个点击数据是否为点击作弊的真实标记;根据每条特征数据的熵、所述条件熵和所述原始类标签的信息熵,获得每条特征数据的信息增益率。结合第一方面,在一些可能的实现方式中,所述调用预设的高斯模型输入所述N条特征数据中高信息增益率的n条特征数据,确定所述M条点击数据中是否有点击作弊的点击数据,包括:从所述N条特征数据中确定出高信息增益率的n条特征数据;调用预设的高斯模型计算所述n条特征数据中每条特征数据的概率密度,获得所述n条特征数据对应的概率密度乘积;根据所述概率密度乘积,确定所述M条点击数据中是否有点击作弊。结合第一方面,在一些可能的实现方式中,所述根据所述概率密度乘积,确定所述M条点击数据中是否有点击作弊,包括:根据所述概率密度乘积,获得M条点击数据中每条点击数据在所述概率密度乘积中对应的概率密度乘积,;根据每条点击数据的所述概率密度乘积中是否小于预设阈值,确定每条点击数据为是否为点击作弊,其中,每条点击数据的所述概率密度乘积小于所述预设阈值表示每条点击数据为点击作弊。第二方面,本申请实施例提供了一种广告点击作弊监测装置,所述装置包括:数据获得模块,用于基于广告的M条点击数据,获得所述M条点击数据中的各种相关数据,M为正整数;特征抽取模块,用于将所述M条点击数据中的各种相关数据按相同维度进行关联,按不同维度进行组合,统计计算得到N条特征数据,N为正整数;特征选择模块,用于获得所述N条特征数据中每条特征数据的信息增益率,其中,每个信息增益率用于表示对应的每个特征数据分类能力的大小;点击作弊确定模块,用于调用预设的高斯模型输入所述N条特征数据中高信息增益率的n条特征数据,确定所述M条点击数据中是否有点击作弊,n为不大于N的正整数。结合第二方面,在一些可能的实现方式中,所述特征选择模块,还用于将所述N条特征数据中每条特征数据进行boxcox变换,获得每条特征数据的变换结果数据;基于每条特征数据的变换结果数据进行特征选择计算,获得每条特征数据的信息增益率。结合第二方面,在一些可能的实现方式中,所述特征选择模块,还用于计算每条特征数据的变换结果数据的熵,以及计算每条特征数据的变换结果数据基于原始类标签的条件熵,其中,所述原始类标签作为一个点击数据是否为点击作弊击的真实标记;根据每条特征数据的熵、所述条件熵和所述原始类标签的信息熵,获得每条特征数据的信息增益率。结合第二方面,在一些可能的实现方式中,所述点击作弊确定模块,还用于从所述N条特征数据中确定出高信息增益率的n条特征数据;调用预设的高斯模型计算所述n条特征数据中每条特征数据的概率密度,获得所述n条特征数据对应的概率密度乘积;根据所述概率密度乘积,确定所述M条点击数据中是否有点击作弊。结合第二方面,在一些可能的实现方式中,所述点击作弊确定模块,还用于根据所述概率密度乘积,获得M条点击数据中每条点击数据在所述概率密度乘积中对应的概率密度乘积,;根据每条点击数据的所述概率密度乘积中是否小于预设阈值,确定每条点击数据为是否为点击作弊,其中,每条点击数据的所述概率密度乘积小于所述预设阈值表示每条点击数据为点击作弊。第三方面,本申请实施例提供了一种电子设备,所述电子设备包括:处理器,存储器,总线和通信模块。所述处理器、所述通信模块和存储器通过所述总线连接。所述存储器,用于存储程序。所述处理器,用于通过调用存储在所述存储器中的第一方面及第一方面的任一种可能的实现方式所述的广告点击作弊监测方法。第四方面,本申请实施例提供了一种具有处理器可执行的非易失的程序代码的计算机可读储存介质,所述程序代码使所述处理器执行第一方面及第一方面的任一种可能的实现方式所述的广告点击作弊监测方法。本申请实施例的有益效果是:通过对广告的M条点击数据解析并关联相同维度、组合不同维度来进行特征抽取,使得基于M条点击数据而统计计算得到N条特征数据,进而便可以计算出每条特征数据的信息增益率。由于信息增益率用于表示特征分类能力的大小,那么通过调用预设的高斯模型输入该N条特征数据中高信息增益率的n条特征数据,则可以确定M条点击数据中是否有点击作弊。实现对点击作弊进行监测,避免了因维护和更新黑名单所造成的资源耗费,且在出现新的点击作弊手段时,利用分析该新的点击作弊中分类能力强的特征也可以对其进行识别,极大的提高反点击作弊防护的安全性。为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1示出了本申请第一实施例提供的一种电子设备的结构框图;图2示出了本申请第二实施例提供的一种广告点击作弊监测方法的流程图本文档来自技高网...

【技术保护点】
1.一种广告点击作弊监测方法,其特征在于,所述方法包括:基于广告的M条点击数据,获得所述M条点击数据中的各种相关数据,M为正整数;将所述M条点击数据中的各种相关数据按相同维度进行关联,按不同维度进行组合,统计计算得到N条特征数据,N为正整数;获得所述N条特征数据中每条特征数据的信息增益率,其中,每个信息增益率用于表示对应的每个特征数据分类能力的大小;调用预设的高斯模型输入所述N条特征数据中高信息增益率的n条特征数据,确定所述M条点击数据中是否有点击作弊,n为不大于N的正整数。

【技术特征摘要】
1.一种广告点击作弊监测方法,其特征在于,所述方法包括:基于广告的M条点击数据,获得所述M条点击数据中的各种相关数据,M为正整数;将所述M条点击数据中的各种相关数据按相同维度进行关联,按不同维度进行组合,统计计算得到N条特征数据,N为正整数;获得所述N条特征数据中每条特征数据的信息增益率,其中,每个信息增益率用于表示对应的每个特征数据分类能力的大小;调用预设的高斯模型输入所述N条特征数据中高信息增益率的n条特征数据,确定所述M条点击数据中是否有点击作弊,n为不大于N的正整数。2.根据权利要求1所述的广告点击作弊监测方法,其特征在于,所述获得所述N条特征数据中每条特征数据的信息增益率,包括:将所述N条特征数据中每条特征数据进行boxcox变换,获得每条特征数据的变换结果数据;基于每条特征数据的变换结果数据进行特征选择,获得每条特征数据的信息增益率。3.根据权利要求2所述的广告点击作弊监测方法。其特征在于,所述基于每条特征数据的变换结果数据进行特征选择,获得每条特征数据的信息增益率,包括:计算每条特征数据的变换结果数据的熵,以及计算每条特征数据的变换结果数据基于原始类标签的条件熵,其中,所述原始类标签作为一个点击数据是否为作弊点击的真实标记;根据每条特征数据的熵、所述条件熵和所述原始类标签的信息熵,获得每条特征数据的信息增益率。4.根据权利要求1-3任一权项所述的广告点击作弊监测方法,其特征在于,所述调用预设的高斯模型输入所述N条特征数据中高信息增益率的n条特征数据,确定所述M条点击数据中是否有点击作弊,包括:从所述N条特征数据中确定出高信息增益率的n条特征数据;调用预设的高斯模型计算所述n条特征数据中每条特征数据的概率密度,获得所述n条特征数据对应的概率密度乘积;根据所述概率密度乘积,确定所述M条点击数据中是否有点击作弊。5.根据权利要求4所述的广告点击作弊监测方法,其特征在于,根据所述概率密度乘积,确定所述M条点击数据中是否有点击作弊,包括:根据所述概率密度乘积,获得M条点击数据中每条点击数据在所述概率密度乘积中对应的概率密度乘积;根据每条点击数据的所述概率密度乘积中是否小于预设阈值,确定每条点击数据为是否为点击作弊,其中,每条点...

【专利技术属性】
技术研发人员:张舒虹
申请(专利权)人:深圳市木瓜移动科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1