异常流量的检测方法和装置制造方法及图纸

技术编号:15283468 阅读:66 留言:0更新日期:2017-05-06 10:07
本申请公开了一种异常流量的检测方法和装置。其中,该方法包括:从广告的监测数据中提取访客访问广告的访客数据;从多个访客数据中提取第一访客数据,其中,第一访客数据为多个访客数据中时间信息在第一预设时间内的访客数据,并且第一访客数据的数量为多个;判断访客标识为同一个第一访客标识的任意两个第一访客数据的时间差是否在第二预设时间内;如果判断出访客标识为同一个第一访客标识的相邻的任意两个第一访客数据的时间差在第二预设时间内,从第一访客数据中提取出第二访客数据,并确定第二访客为导致流量异常的访客。本申请解决了现有技术中由于某些访客流量作弊造成的广告主利益受损害的技术问题。

Method and device for detecting abnormal flow

The invention discloses a method and a device for detecting abnormal flow. Among them, the method includes: extracting data from visitors visitors advertising advertising monitoring data; extracting the first visitor data from multiple visitor data in which the first time visitor data for multiple visitor data information in the first preset time visitor data, and the number of visitors to a plurality of first data; determine the guest identification for the same first guest identification of any two visitors the first time difference data is in the second preset time; if the visitor sign is any one of the first visitors identified two adjacent first visitor data the time difference in the second preset time, extract the data from the first second visitors the visitor data, and identify second visitors to lead to abnormal flow of visitors. The utility model solves the technical problems of the damage of the main benefits of the advertisement in the prior art because of the cheating of some visitors.

【技术实现步骤摘要】

本申请涉及数据处理领域,具体而言,涉及一种异常流量的检测方法和装置
技术介绍
互联网广告就是通过网络平台在网络上投放广告,利用网站上的广告条幅、文本链接、多媒体的方法,在互联网上刊登或发布广告,通过网络传递到互联网用户的一种高科技广告运作方法。与传统的四大媒体(报纸、杂志、电视、广播)广告及户外广告相比,互联网广告具有得天独厚的优势,是实施现代营销媒体战略的重要的一部分。对于广告主在互联网广告平台上投放的广告,互联网用户的访问情况是评价一个广告效果的重要指标,如广告的曝光量、点击量、访客的访问量、访问时长、访问页面数等等。广告的曝光量、点击量是广告媒体收取费用的凭借之一,实际投放中,有不少媒体利用虚假流量来提高广告主的广告曝光量和点击量,从而获得更多的利益,广告主就要对没有任何效果的虚假流量买单,流量作弊对广告主的利益产生了损害。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种异常流量的检测方法和装置,以至少解决现有技术中由于某些访客流量作弊造成的广告主利益受损害的技术问题。根据本申请实施例的一个方面,提供了一种异常流量的检测方法,包括:从广告的监测数据中提取访客访问所述广告的访客数据,其中,所述访客和所述访客数据均为多个,每个所述访客数据均包括访客标识和访问所述广告的时间信息;从多个所述访客数据中提取第一访客数据,其中,所述第一访客数据为多个所述访客数据中时间信息在第一预设时间内的访客数据,并且所述第一访客数据的数量为多个;判断访客标识为同一个第一访客标识的任意两个所述第一访客数据的时间差是否在第二预设时间内;如果判断出访客标识为同一个所述第一访客标识的相邻的任意两个所述第一访客数据的时间差在所述第二预设时间内,从所述第一访客数据中提取出第二访客数据,并确定所述第二访客为导致流量异常的访客,其中,所述第二访客数据为满足第一预设条件的所述第一访客数据,所述第一预设条件为访客标识为同一个所述第一访客标识的任意两个所述第一访客数据的时间差在所述第二预设时间内。进一步地,在从多个所述访客数据中提取第一访客数据之后,所述方法还包括:将所述第一访客数据存储至第一数据库。进一步地,在从所述第一访客数据中提取出第二访客数据之后,所述方法还包括:将所述第二访客数据存储至第二数据库。进一步地,在从所述第一访客数据中提取出第二访客数据之后,所述方法还包括:根据所述第二访客数据的时间信息,计算访客标识相同的所述第二访客数据随时间的分布。进一步地,在计算访客标识相同的所述第二访客数据随时间的分布之后,所述方法还包括:提取目标访客的目标时间段,其中,所述目标访客是所述第二访客数据的访客标识所标识的访客,所述目标时间段是满足第二预设条件的时间段,所述第二预设条件是在所述目标时间段内,所述第二访客数据的个数大于第一阈值;对多个所述目标访客的相同的目标时间段的个数进行求和,得到多个所述目标时间段的数量;筛选出多个所述目标时间段中数量大于第二阈值的目标时间段,得到容易产生异常流量的时间段。根据本申请实施例的另一方面,提供了一种异常流量的检测装置,包括:第一提取单元,用于从广告的监测数据中提取访客访问所述广告的访客数据,其中,所述访客和所述访客数据均为多个,每个所述访客数据均包括访客标识和访问所述广告的时间信息;第二提取单元,用于从多个所述访客数据中提取第一访客数据,其中,所述第一访客数据为多个所述访客数据中时间信息在第一预设时间内的访客数据,并且所述第一访客数据的数量为多个;判断单元,用于判断访客标识为同一个第一访客标识的任意两个所述第一访客数据的时间差是否在第二预设时间内;第三提取单元,用于当判断出访客标识为同一个所述第一访客标识的相邻的任意两个所述第一访客数据的时间差在所述第二预设时间内时,从所述第一访客数据中提取出第二访客数据,并确定所述第二访客为导致流量异常的访客,其中,所述第二访客数据为满足第一预设条件的所述第一访客数据,所述第一预设条件为访客标识为同一个所述第一访客标识的任意两个所述第一访客数据的时间差在所述第二预设时间内。进一步地,所述装置还包括:第一存储单元,用于在所述第二提取单元从多个所述访客数据中提取第一访客数据之后,将所述第一访客数据存储至第一数据库。进一步地,所述装置还包括:第二存储单元,用于在所述第三提取单元从所述第一访客数据中提取出第二访客数据之后,将所述第二访客数据存储至第二数据库。进一步地,所述装置还包括:第一计算单元,用于在所述第三提取单元从所述第一访客数据中提取出第二访客数据之后,根据所述第二访客数据的时间信息,计算访客标识相同的所述第二访客数据随时间的分布。进一步地,所述装置还包括:第四提取单元,用于在所述第一计算单元计算访客标识相同的所述第二访客数据随时间的分布之后,提取目标访客的目标时间段,其中,所述目标访客是所述第二访客数据的访客标识所标识的访客,所述目标时间段是满足第二预设条件的时间段,所述第二预设条件是在所述目标时间段内,所述第二访客数据的个数大于第一阈值;第二计算单元,用于对多个所述目标访客的相同的目标时间段的个数进行求和,得到多个所述目标时间段的数量;筛选单元,用于筛选出多个所述目标时间段中数量大于第二阈值的目标时间段,得到容易产生异常流量的时间段。在本申请实施例中,采用从广告的监测数据中提取访客访问广告的访客数据,其中,访客和访客数据均为多个,每个访客数据均包括访客标识和访问广告的时间信息,从多个访客数据中提取第一访客数据,其中,第一访客数据为多个访客数据中时间信息在第一预设时间内的访客数据,并且第一访客数据的数量为多个,判断访客标识为同一个第一访客标识的相邻的任意两个第一访客数据的时间差是否在第二预设时间内,如果判断出访客标识为同一个第一访客标识的任意两个第一访客数据的时间差在第二预设时间内,从第一访客数据中提取出第二访客数据,并确定所述第二访客为导致流量异常的访客,其中,第二访客数据为满足第一预设条件的第一访客数据,第一预设条件为访客标识为同一个第一访客标识的任意两个第一访客数据的时间差在第二预设时间内。通过提取出指定时间段内的访客数据,判断提取出来的访客数据中,属于同一个访客的若干条访客数据中相邻的任意两条访客数据的时间差是不是非常短,如果判断出属于同一个访客的若干条访客数据的相邻的任意两条访客数据的时间差非常短,那么确定这个访客为进行了流量作弊的访客,该访客产生的流量为作弊流量,即虚假流量,也可以说是异常流量,实现了筛选出进行了流量作弊的访客的技术效果,进而解决了现有技术中由于某些访客流量作弊造成的广告主利益受损害的技术问题。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请实施例的异常流量的检测方法的流程图;图2是根据本申请实施例所提供的异常流量的检测方法进行异常流量检测的流程图;以及图3是根据本申请实施例的异常流量的检测装置的示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例本文档来自技高网
...
异常流量的检测方法和装置

【技术保护点】
一种异常流量的检测方法,其特征在于,包括:从广告的监测数据中提取访客访问所述广告的访客数据,其中,所述访客和所述访客数据均为多个,每个所述访客数据均包括访客标识和访问所述广告的时间信息;从多个所述访客数据中提取第一访客数据,其中,所述第一访客数据为多个所述访客数据中时间信息在第一预设时间内的访客数据,并且所述第一访客数据的数量为多个;判断访客标识为同一个第一访客标识的任意两个所述第一访客数据的时间差是否在第二预设时间内;如果判断出访客标识为同一个所述第一访客标识的相邻的任意两个所述第一访客数据的时间差在所述第二预设时间内,从所述第一访客数据中提取出第二访客数据,并确定所述第二访客为导致流量异常的访客,其中,所述第二访客数据为满足第一预设条件的所述第一访客数据,所述第一预设条件为访客标识为同一个所述第一访客标识的任意两个所述第一访客数据的时间差在所述第二预设时间内。

【技术特征摘要】
1.一种异常流量的检测方法,其特征在于,包括:从广告的监测数据中提取访客访问所述广告的访客数据,其中,所述访客和所述访客数据均为多个,每个所述访客数据均包括访客标识和访问所述广告的时间信息;从多个所述访客数据中提取第一访客数据,其中,所述第一访客数据为多个所述访客数据中时间信息在第一预设时间内的访客数据,并且所述第一访客数据的数量为多个;判断访客标识为同一个第一访客标识的任意两个所述第一访客数据的时间差是否在第二预设时间内;如果判断出访客标识为同一个所述第一访客标识的相邻的任意两个所述第一访客数据的时间差在所述第二预设时间内,从所述第一访客数据中提取出第二访客数据,并确定所述第二访客为导致流量异常的访客,其中,所述第二访客数据为满足第一预设条件的所述第一访客数据,所述第一预设条件为访客标识为同一个所述第一访客标识的任意两个所述第一访客数据的时间差在所述第二预设时间内。2.根据权利要求1所述的方法,其特征在于,在从多个所述访客数据中提取第一访客数据之后,所述方法还包括:将所述第一访客数据存储至第一数据库。3.根据权利要求1所述的方法,其特征在于,在从所述第一访客数据中提取出第二访客数据之后,所述方法还包括:将所述第二访客数据存储至第二数据库。4.根据权利要求1所述的方法,其特征在于,在从所述第一访客数据中提取出第二访客数据之后,所述方法还包括:根据所述第二访客数据的时间信息,计算访客标识相同的所述第二访客数据随时间的分布。5.根据权利要求4所述的方法,其特征在于,在计算访客标识相同的所述第二访客数据随时间的分布之后,所述方法还包括:提取目标访客的目标时间段,其中,所述目标访客是所述第二访客数据的访客标识所标识的访客,所述目标时间段是满足第二预设条件的时间段,所述第二预设条件是在所述目标时间段内,所述第二访客数据的个数大于第一阈值;对多个所述目标访客的相同的目标时间段的个数进行求和,得到多个所述目标时间段的数量;筛选出多个所述目标时间段中数量大于第二阈值的目标时间段,得到容易产生异常流量的时间段。6.一种异常流量的检测装置,其特征在于,包括:第一提取单元,用于从广告的监测数据中提取访客访问所述广告的访客数据,其中...

【专利技术属性】
技术研发人员:安桂雪唐珺
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1