一种识别作弊流量的方法及装置制造方法及图纸

技术编号:20800935 阅读:22 留言:0更新日期:2019-04-06 14:44
本发明专利技术公开了一种识别作弊流量的方法及装置,可以获取来自设定渠道的设定时长内的访问流量的页面停留时长分布,并将该访问流量的页面停留时长分布,与对应该渠道的所述设定时长内的正常用户页面停留时长分布进行对比。如果该访问流量的页面停留时长分布,与对应该渠道的所述设定时长内的正常用户页面停留时长分布不同,并且其页面停留时长分布呈现作弊流量典型的页面停留时长U型分布,则可以判断该访问流量为作弊流量。本发明专利技术技术方案从访问流量的页面停留时长分布入手判断其是否为作弊流量,具备更高的判断准确性。

A Method and Device for Identifying Cheating Flow

The invention discloses a method and device for identifying cheating traffic, which can obtain the page residence time distribution of the access traffic from the set time of the set channel, and compare the page residence time distribution of the access traffic with the normal user page residence time distribution of the set time of the corresponding channel. If the page residence time distribution of the access traffic is different from that of the normal user pages within the specified length of the corresponding channel, and the page residence time distribution presents a U-shaped distribution of the typical page residence time of the cheating traffic, the cheating traffic can be judged as the cheating traffic. The technical scheme of the invention judges whether the page of the visiting traffic is a cheating traffic from the distribution of the page residence time, and has a higher judging accuracy.

【技术实现步骤摘要】
一种识别作弊流量的方法及装置
本专利技术涉及流量监控
,尤其涉及一种识别作弊流量的方法及装置。
技术介绍
互联网广告引流是各大网站获取新流量的重要方式之一。在互联网广告引流方案中,广告主通过广告售卖方(广告渠道)展示广告链接,用户在广告售卖方网站点击广告主的广告链接,访问广告主网站,即完成了广告引流的目的。而部分广告售卖方经常利用机器(计算机)模拟用户点击广告主的广告链接,以流量作弊的方法欺骗广告主,以损害广告主的利益而获取收益。因此,对于广告主来说,识别作弊流量,是提高广告效益的重要手段。常用的识别作弊流量的方法是,计算多个指标维度(广告来源、浏览器版本、操作系统等)下页面访问的平均停留时间和停留页面,作为识别作弊流量的判断指标。这些指标虽然易于计算和展示,但是也容易被机器模仿,由此导致,以页面访问的平均停留时间和停留页面为依据,并不能准确地识别作弊流量。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的识别作弊流量的方法及装置。具体方案如下:一种识别作弊流量的方法,包括:获取来自设定渠道的设定时长内的访问流量;其中,所述访问流量包括在所述设定时长内,来自所述设定渠道的页面访问;根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布;将分析得到的所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布进行对比,判断所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布是否相同;如果所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布不同,则判断所述访问流量的页面停留时长分布是否呈U型分布;如果所述访问流量的页面停留时长分布呈U型分布,则确认所述访问流量为作弊流量。可选的,所述根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布,包括:分别统计所述访问流量中的各个页面访问的页面停留时长;根据所述访问流量中的各个页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的页面访问数量;分别计算得到所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值;根据所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,汇总得到所述访问流量的页面停留时长分布。可选的,所述判断所述访问流量的页面停留时长分布是否呈U型分布,包括:判断所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,是否随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式;如果所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式,则确认所述访问流量的页面停留时长分布呈U型分布。可选的,该方法还包括:预先计算得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布。可选的,所述预先计算得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布,包括:分别统计来自所述设定渠道的,所述设定时长内的各个正常用户页面访问的页面停留时长;根据所述各个正常用户页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的正常用户页面访问数量;分别计算得到所述各个页面停留时长区间内的正常用户页面访问数量,与来自所述设定渠道的,所述设定时长内的总的正常用户页面访问数量的比值;根据所述各个页面停留时长区间内的正常用户页面访问数量,与来自所述设定渠道的,所述设定时长内的总的正常用户页面访问数量的比值,汇总得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布。一种识别作弊流量的装置,包括:流量获取单元,用于获取来自设定渠道的设定时长内的访问流量;其中,所述访问流量包括在所述设定时长内,来自所述设定渠道的页面访问;分析处理单元,用于根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布;对比处理单元,用于将所述分析处理单元分析得到的所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布进行对比,判断所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布是否相同;判断处理单元,用于当所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布不同时,判断所述访问流量的页面停留时长分布是否呈U型分布;如果所述访问流量的页面停留时长分布呈U型分布,则确认所述访问流量为作弊流量。可选的,所述分析处理单元,包括:第一统计单元,用于分别统计所述访问流量中的各个页面访问的页面停留时长;第二统计单元,用于根据所述访问流量中的各个页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的页面访问数量;计算单元,用于分别计算得到所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值;汇总处理单元,用于根据所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,汇总得到所述访问流量的页面停留时长分布。可选的,所述判断处理单元判断所述访问流量的页面停留时长分布是否呈U型分布时,具体用于:判断所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,是否随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式;如果所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式,则确认所述访问流量的页面停留时长分布呈U型分布。可选的,该装置还包括:预处理单元,用于预先计算得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布。可选的,所述预处理单元,包括:第一计算单元,用于分别统计来自所述设定渠道的,所述设定时长内的各个正常用户页面访问的页面停留时长;第二计算单元,用于根据所述各个正常用户页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的正常用户页面访问数量;第三计算单元,用于分别计算得到所述各个页面停留时长区间内的正常用户页面访问数量,与来自所述设定渠道的,所述设定时长内的总的正常用户页面访问数量的比值;整合处理单元,用于根据所述各个页面停留时长区间内的正常用户页面访问数量,与来自所述设定渠道的,所述设定时长内的总的正常用户页面访问数量的比值,汇总得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布。借由上述技术方案,本专利技术提供的识别作弊流量的方法及装置,分析来自设定渠道的设定时长内的访问流量的页面停留时长分布,并将该访问流量的页面停留时长分布,与对应该渠道的所述设定时长内的正常用户页面停留时长分布进行对比。如果该访问流量的页面停留时长分布,与对应该渠道的所述设定时长内的正常用户页面停留时长分布不同,并且其页面停留时长分布呈现作弊流量典型的页面停留时长U型分布,则可以判本文档来自技高网...

【技术保护点】
1.一种识别作弊流量的方法,其特征在于,包括:获取来自设定渠道的设定时长内的访问流量;其中,所述访问流量包括在所述设定时长内,来自所述设定渠道的页面访问;根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布;将分析得到的所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布进行对比,判断所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布是否相同;如果所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布不同,则判断所述访问流量的页面停留时长分布是否呈U型分布;如果所述访问流量的页面停留时长分布呈U型分布,则确认所述访问流量为作弊流量。

【技术特征摘要】
1.一种识别作弊流量的方法,其特征在于,包括:获取来自设定渠道的设定时长内的访问流量;其中,所述访问流量包括在所述设定时长内,来自所述设定渠道的页面访问;根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布;将分析得到的所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布进行对比,判断所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布是否相同;如果所述访问流量的页面停留时长分布,与对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布不同,则判断所述访问流量的页面停留时长分布是否呈U型分布;如果所述访问流量的页面停留时长分布呈U型分布,则确认所述访问流量为作弊流量。2.根据权利要求1所述的方法,其特征在于,所述根据所述访问流量中的各个页面访问的页面停留时长,分析所述访问流量的页面停留时长分布,包括:分别统计所述访问流量中的各个页面访问的页面停留时长;根据所述访问流量中的各个页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的页面访问数量;分别计算得到所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值;根据所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,汇总得到所述访问流量的页面停留时长分布。3.根据权利要求2所述的方法,其特征在于,所述判断所述访问流量的页面停留时长分布是否呈U型分布,包括:判断所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,是否随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式;如果所述各个页面停留时长区间内的页面访问数量,与所述访问流量中的总页面访问数量的比值,随着页面停留时长区间所表征的页面停留时长的增加,呈先减小后增大的变化形式,则确认所述访问流量的页面停留时长分布呈U型分布。4.根据权利要求1所述的方法,其特征在于,该方法还包括:预先计算得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布。5.根据权利要求4所述的方法,其特征在于,所述预先计算得到对应所述设定渠道的,所述设定时长内的正常用户页面停留时长分布,包括:分别统计来自所述设定渠道的,所述设定时长内的各个正常用户页面访问的页面停留时长;根据所述各个正常用户页面访问的页面停留时长,分别统计预先划分的各个页面停留时长区间内的正常用户页面访问数量;分别计算得到所述各个页面停留时长区间内的正常用户页面访问数量,与来自所述设定渠道的,所述设定时长内的总的正常用户页面访...

【专利技术属性】
技术研发人员:刘振华
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1