点击热力图异常检测方法及装置制造方法及图纸

技术编号:21630323 阅读:32 留言:0更新日期:2019-07-17 11:32
本发明专利技术公开了一种点击热力图异常检测方法及装置,可以获得第一点击热力图,将所述第一点击热力图分割为多个区域;对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域。本发明专利技术根据各区域中各点击来源对应的点击行为发生在该区域中的点击概率确定异常点击区域,无需通过人工识别,准确性和识别效率较高。

Click Thermodynamic Diagram Anomaly Detection Method and Device

【技术实现步骤摘要】
点击热力图异常检测方法及装置
本专利技术涉及流量作弊检测领域,尤其涉及点击热力图异常检测方法及装置。
技术介绍
随着互联网的发展,用户更多的通过电子设备浏览各种网站的网页或应用程序的界面。通过购买广告可以为广告购买方带来更多的互联网流量,从而使得更多的用户浏览和点击广告购买方网站的网页或应用程序的界面。但流量作弊行为长期损害着广告购买方的正当权益,例如一些刷流量的软件会自动且大量的访问广告购买方的网站并进行大量点击操作,这些点击操作没有为广告购买方带来收益,但广告购买方却需要为之付费。由于点击热力图可以很好的体现网站的网页或应用程序的界面中的点击情况,因此可以根据点击热力图确定异常点击行为从而识别异常流量。现有技术通过人工对点击热力图中的异常点击行为进行识别,准确性和识别效率较低。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的点击热力图异常检测方法及装置,方案如下:一种点击热力图异常检测方法,包括:获得第一点击热力图,将所述第一点击热力图分割为多个区域;对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,其中,所述异常点击区域为所述多个区域中的至少一个区域。可选的,所述将所述第一点击热力图分割为多个区域,包括:将所述第一点击热力图平均分割为row×col个矩形区域,其中,row为所述第一点击热力图中所述矩形区域的行数,col为所述第一点击热力图中所述矩形区域的列数。可选的,所述对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,包括:对每一个点击来源P:确定该点击来源P相对于其他点击来源的第一相对熵D1,其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率,为除点击来源P外的其他点击来源在第i行第j列的矩形区域的点击概率,di,j为0或1;在D1小于第一预设阈值的情况下,确定在∑di,j的取值最大时的各di,j;在∑di,j的取值最大时的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。可选的,所述对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,包括:确定各点击来源相对于其他点击来源的第二相对熵的和H最小时的各点击来源对应的各di,j,其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率,为除点击来源P外的其他点击来源在第i行第j列的矩形区域的点击概率,di,j为0或1,δ为惩罚系数,b为基准点击概率,b=1/(row×col);对每一个点击来源:将该点击来源对应的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。可选的,所述对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,包括:对每个矩形区域:确定该矩形区域对应的各点击来源间的点击概率之比的最大值;将大于第二预设阈值的所述最大值对应的矩形区域确定为异常点击区域,其中,所述第二预设阈值大于1。一种点击热力图异常检测装置,包括:热力图获得单元、概率确定单元和区域确定单元,所述热力图获得单元,用于获得第一点击热力图,将所述第一点击热力图分割为多个区域;所述概率确定单元,用于对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;所述区域确定单元,用于对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,其中,所述异常点击区域为所述多个区域中的至少一个区域。可选的,所述热力图获得单元具体设置为:将所述第一点击热力图平均分割为row×col个矩形区域,其中,row为所述第一点击热力图中所述矩形区域的行数,col为所述第一点击热力图中所述矩形区域的列数。可选的,所述区域确定单元具体设置为:对每一个点击来源P:确定该点击来源P相对于其他点击来源的第一相对熵D1,其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率,为除点击来源P外的其他点击来源在第i行第j列的矩形区域的点击概率,di,j为0或1;在D1小于第一预设阈值的情况下,确定在∑di,j的取值最大时的各di,j;在∑di,j的取值最大时的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述的任一种点击热力图异常检测方法。一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述的任一种点击热力图异常检测方法。借由上述技术方案,本专利技术提供的点击热力图异常检测方法及装置,可以获得第一点击热力图,将所述第一点击热力图分割为多个区域;对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域。本专利技术根据各区域中各点击来源对应的点击行为发生在该区域中的点击概率确定异常点击区域,无需通过人工识别,准确性和识别效率较高。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术实施例提供的一种点击热力图异常检测方法的流程图;图2示出了本专利技术实施例提供的一种点击热力图异常检测装置的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。如图1所示,本专利技术实施例提供的一种点击热力图异常检测方法,可以包括:S100、获得第一点击热力图,将所述第一点击热力图分割为多个区域;其中,步骤S100可以具体包括:将所述第一点击热力图平均分割为row×col个矩形区域,其中,row为所述第一点击热力图中所述矩形区域的行数,col为所述第一点击热力图中所述矩形区域的列数。在实际应用中,获得第一点击热力图的方式可以包括:从终端设备中采集点击数据;对采集的点击数据进行归一化处理;根据归一化处理后的点击数据获得第一点击热力图。具体的,本专利技术可以在终端设备中部署js代码,将访问者发出点击行为作为触发条件,当点击行为发生时,本专利技术部署的js代码将点击数据通过post请求发送至服务器中,这样就完成了从终端设备中采集点击数据的过程。由于不同网页在不同分辨率、页面大小的情况下,网页元素位置可能发现较大的改变,因此本专利技术可以对点击数据进行归一化处理,以排除分辨率、页面大小给网页元素位本文档来自技高网...

【技术保护点】
1.一种点击热力图异常检测方法,其特征在于,包括:获得第一点击热力图,将所述第一点击热力图分割为多个区域;对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,其中,所述异常点击区域为所述多个区域中的至少一个区域。

【技术特征摘要】
1.一种点击热力图异常检测方法,其特征在于,包括:获得第一点击热力图,将所述第一点击热力图分割为多个区域;对所述多个区域中每个区域:分别确定各点击来源对应的点击行为发生在该区域中的点击概率;对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,其中,所述异常点击区域为所述多个区域中的至少一个区域。2.根据权利要求1所述的方法,其特征在于,所述将所述第一点击热力图分割为多个区域,包括:将所述第一点击热力图平均分割为row×col个矩形区域,其中,row为所述第一点击热力图中所述矩形区域的行数,col为所述第一点击热力图中所述矩形区域的列数。3.根据权利要求2所述的方法,其特征在于,所述对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,包括:对每一个点击来源P:确定该点击来源P相对于其他点击来源的第一相对熵D1,其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率,为除点击来源P外的其他点击来源在第i行第j列的矩形区域的点击概率,di,j为0或1;在D1小于第一预设阈值的情况下,确定在∑di,j的取值最大时的各di,j;在∑di,j的取值最大时的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。4.根据权利要求2所述的方法,其特征在于,所述对每个点击来源:根据所述点击概率确定该点击来源对应的异常点击区域,包括:确定各点击来源相对于其他点击来源的第二相对熵的和H最小时的各点击来源对应的各di,j,其中,i为矩形区域的行编号,j为矩形区域的列编号,di,j为区域异常标识,pi,j为点击来源P在第i行第j列的矩形区域的点击概率,为除点击来源P外的其他点击来源在第i行第j列的矩形区域的点击概率,di,j为0或1,δ为惩罚系数,b为基准点击概率,b=1/(row×col);对每一个点击来源:将该点击来源对应的各di,j中取值为0的di,j对应的矩形区域确定为异常点击区域。5.根据权利要求2所述的...

【专利技术属性】
技术研发人员:刘振华
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1