一种互联网监测反作弊方法和装置制造方法及图纸

技术编号:10451506 阅读:220 留言:0更新日期:2014-09-18 16:19
一种互联网监测反作弊方法和装置,涉及计算机网络技术领域。为了更准确的识别网络活动点击量或者浏览数的异常,检测互联网网络活动作弊行为,利用多种监测方案对单次网络活动进行数据收集,获得多组独立的监测数据;对所述多组独立的监测数据进行匹配,判断所述多组独立的监测数据是否属于同一个网络行为,将被判断为属于同一个网络行为的所有监测数据汇总为该网络行为的日志记录;对各网络行为的所述日志记录进行作弊流量分析,获得分析结果。本发明专利技术可以应用于互联网网络活动的反作弊监测过程中,诸如互联网广告投放的反作弊监控和网络调研的反作弊监测,还可以是其他类型网络活动的反作弊监测。

【技术实现步骤摘要】
一种互联网监测反作弊方法和装置
本专利技术涉及计算机网络
,尤其涉及一种互联网监测反作弊方法和装置。
技术介绍
互联网广告投放活动中,所有用户参与到广告活动中的行为总量,例如总浏览数、总点击数等等,是衡量广告投放效果的基本指标。这些指标被媒体和广告主广泛用于广告投放活动的费用结算。媒体能提供的最大浏览量、最大点击量等指标也直接体现了其投放广告的能力。实际投放中,部分媒体可能会采用伪造非真实流量的方式来提高广告主方监测到的曝光数、点击数等指标,从而达到从广告主方获取额外的收入或是夸大自己的广告投放能力等目的。另一方面,这些伪造的虚假流量对于广告主的利益有着恶劣的影响。例如当广告主和媒体按照广告的曝光数来进行结算时,广告主就必须为没有任何广告效果的虚假曝光花费额外的预算。 非真实的虚假流量可以由多种方式产生。例如:利用病毒/木马等恶意手段入侵普通互联网电脑并控制这些电脑进行额外的广告浏览和点击;利用脚本和软件模拟正常用户访问网站的行为;在网站中插入浏览器不可见的隐藏代码来凭空产生额外流量等。针对这些作弊方式,现有的反作弊方法主要通过监测浏览、点击等网络行为发生时的上下文信息来进行异常流量的识别。例如,如果在很短的时间内同一个IP地址发生了极频繁的浏览/点击,远远超出了正常用户的上网频率,那么就可以判断这个IP地址存在作弊嫌疑。又例如,目前一种常见的作弊方式是在价格较低的广告位上播放本来不应该在这个位置上投放的高价广告,即通过将低价广告位的曝光伪装高价广告位的曝光获利。针对这种作弊方式,反作弊系统通过监测广告曝光时的URL(统一资源定位符,Uniform Resource Locator),并跟投放计划中购买的广告位置的资源信息进行对比。 然而,当作弊者获知一个特定规则的反作弊技术实现手段后,其可以相应地修改作弊方式使得作弊行为难以被识别。例如,当作弊者知道反作弊方法使用URL比对来进行作弊检测时,作弊者可通过技术手段将反作弊系统监测到的URL伪装成正常URL的手法以逃避作弊行为被反作弊系统捕获。此时,反作弊系统亦需要相应地调整己方的技术手段才能重新识别出作弊者。因此,在实际中反作弊者和作弊者之间存在博弈关系。目前反作弊系统主要是通过监测代码、监测脚本或客户端来收集用户上网过程中的行为数据,再利用这些数据进行作弊检测。常见的反作弊系统的数据获取方式较为固定,收集到的数据较为单一和有限。在持续使用较长时间后,其方法就可能会被作弊者针对而导致反作弊能力的下降。
技术实现思路
为了更准确的识别网络活动点击量或者浏览数的异常,检测互联网网络活动作弊行为,本专利技术提出一种互联网监测反作弊方法和装置。 为了解决上述技术问题,本专利技术提供了一种互联网监测反作弊方法,包括: A、利用多种监测方案对单次网络活动进行数据收集,获得多组独立的监测数据; B、对所述多组独立的监测数据进行匹配,判断所述多组独立的监测数据是否属于同一个网络行为,将被判断为属于同一个网络行为的所有监测数据汇总为该网络行为的日志记录; C、对各网络行为的所述日志记录进行作弊流量分析,获得分析结果。 进一步地,所述多种监测方案包括在网络行为发生的网页框架中直接嵌入代码、在访问页面中的Flash动画或JavaScript脚本中嵌入代码、在用户机上安装浏览器插件或客户端软件。 进一步地,对所述多组独立的监测数据进行匹配,判断所述多组独立的监测数据是否属于同一个网络行为的步骤包括: B1、将监测数据的字段分为一个或者多个精确匹配字段,或者将监测数据的字段分为一个或者多个精确匹配字段和一个或者多个模糊匹配字段; B2、将多组独立的监测数据按字段进行两两比对; 对于精确匹配字段进行比对时,当两组独立的监测数据的所述精确匹配字段有一个或者多个不相同时,则判断所述两组独立的监测数据不属于同一个网络行为; 对于模糊匹配字段进行比对时,当两组独立的监测数据的所述模糊匹配字段有一个或者多个差距大于该字段的模糊阈值时,则判断所述两组独立的监测数据不属于同一个网络行为; 对于所有精确匹配字段都相同,并且所有模糊匹配字段的差距都小于模糊阈值时,则判断所述两组独立的监测数据属于同一个网络行为。 或者 bl、将监测数据的字段分为一个或者多个精确匹配字段,或者将监测数据的字段分为一个或者多个精确匹配字段和一个或者多个模糊匹配字段; b2、将多组独立的监测数据进行两两比对; 对于精确匹配字段进行比对时,当两组独立的监测数据的所述精确匹配字段相同时,则将该字段的匹配度置为1,当两组独立的监测数据的所述精确匹配字段不相同时,则将该字段的匹配度置为O ; 对于模糊匹配字段进行比对时,按照模糊匹配字段的差距将该字段的匹配度置为O到I的数值;并将所有模糊匹配字段的匹配度相加,获得总匹配度; 当两组独立的监测数据的所述精确匹配字段有一个或者多个匹配度为O时,则判断所述两组独立的监测数据不属于同一个网络行为; 当模糊匹配字段总匹配度小于匹配阈值时,则判断所述两组独立的监测数据不属于同一个网络行为; 当两组独立的监测数据的所述精确匹配字段匹配度均为1,且模糊匹配字段总匹配度大于匹配阈值时,则判断所述两组独立的监测数据属于同一个网络行为。 进一步地,精确匹配字段包括网络行为发生的用户机的身份标识ID,模糊匹配字段包括统一资源定位符URL、网络行为发生时间Time,网络行为发送的用户机的协议地址IP,网络行为发生的用户机的浏览器Browser,网络行为发生的用户机的操作系统OS。 进一步地,作弊流量分析包括:监测所述网络行为日志记录中多组监测数据中的同一监测参数的不匹配程度来识别伪造的数据。 进一步地,步骤C的分析结果包括所有日志记录中作弊流量的百分比和作弊流量的数据源。 为了解决上述技术问题,本专利技术还提供了一种互联网监测反作弊装置,包括:多个数据采集模块、匹配模块和分析模块, 所述数据采集模块,用于利用监测方案对单次网络活动进行数据收集,获得监测数据; 所述匹配模块,用于对多组独立的监测数据进行匹配,判断所述多组独立的监测数据是否属于同一个网络行为,将被判断为属于同一个网络行为的所有监测数据汇总为一项日志记录; 所述分析模块,用于对所述日志记录进行作弊流量分析,获得分析结果。 进一步地,所述匹配模块包括精确匹配模块、模糊匹配模块和判断模块; 所述精确匹配模块,用于对两组独立的监测数据的精确匹配字段进行比对,并获得精确比对结果; 所述模糊匹配模块,用于对两组独立的监测数据的模糊匹配字段进行比对,并获得模糊比对结果; 所述判断模块,用于根据精确比对结果和模糊比对结果,判断所述多组独立的监测数据是否属于同一个网络行为。 进一步地,判断模块的判断依据为: 当有一个或者多个精确比对结果不相同时,则判断所述两组独立的监测数据不属于同一个网络行为; 当有一个或者多个模糊匹配字段的差距大于该字段的模糊阈值时,则判断所述两组独立的监测数据不属于同一个网络行为; 当所有精确匹配字段都相同,并且所有模糊匹配字段的差距都小于模糊阈值时,则判断所述两组独立的监测数据属于同一个网络行为; 或者, 当有一个或者多个本文档来自技高网
...
一种互联网监测反作弊方法和装置

【技术保护点】
一种互联网监测反作弊方法,其特征在于,包括:A、利用多种监测方案对单次网络活动进行数据收集,获得多组独立的监测数据;B、对所述多组独立的监测数据进行匹配,判断所述多组独立的监测数据是否属于同一个网络行为,将被判断为属于同一个网络行为的所有监测数据汇总为该网络行为的日志记录;C、对各网络行为的所述日志记录进行作弊流量分析,获得分析结果。

【技术特征摘要】
1.一种互联网监测反作弊方法,其特征在于,包括: A、利用多种监测方案对单次网络活动进行数据收集,获得多组独立的监测数据; B、对所述多组独立的监测数据进行匹配,判断所述多组独立的监测数据是否属于同一个网络行为,将被判断为属于同一个网络行为的所有监测数据汇总为该网络行为的日志记录; C、对各网络行为的所述日志记录进行作弊流量分析,获得分析结果。2.如权利要求1所述的方法,其特征在于:所述多种监测方案包括在网络行为发生的网页框架中直接嵌入代码、在访问页面中的Flash动画或JavaScript脚本中嵌入代码、在用户机上安装浏览器插件或客户端软件。3.如权利要求1所述的方法,其特征在于:对所述多组独立的监测数据进行匹配,判断所述多组独立的监测数据是否属于同一个网络行为的步骤包括: B1、将监测数据的字段分为一个或者多个精确匹配字段,或者将监测数据的字段分为一个或者多个精确匹配字段和一个或者多个模糊匹配字段; B2、将多组独立的监测数据按字段进行两两比对; 对于精确匹配字段进行比对时,当两组独立的监测数据的所述精确匹配字段有一个或者多个不相同时,则判断所述两组独立的监测数据不属于同一个网络行为; 对于模糊匹配字段进行比对时,当两组独立的监测数据的所述模糊匹配字段有一个或者多个差距大于该字段的模糊阈值时,则判断所述两组独立的监测数据不属于同一个网络行为;对于所有精确匹配字段都相同,并且所有模糊匹配字段的差距都小于模糊阈值时,则判断所述两组独立的监测数据属于同一个网络行为。4.如权利要求1所述的方法,其特征在于:对所述多组独立的监测数据进行匹配,判断所述多组独立的监测数据是否属于同一个网络行为的步骤包括: bl、将监测数据的字段分为一个或者多个精确匹配字段,或者将监测数据的字段分为一个或者多个精确匹配字段和一个或者多个模糊匹配字段; b2、将多组独立的监测数据进行两两比对; 对于精确匹配字段进行比对时,当两组独立的监测数据的所述精确匹配字段相同时,则将该字段的匹配度置为1,当两组独立的监测数据的所述精确匹配字段不相同时,则将该字段的匹配度置为O ; 对于模糊匹配字段进行比对时,按照模糊匹配字段的差距将该字段的匹配度置为O到I的数值;并将所有模糊匹配字段的匹配度相加,获得总匹配度; 当两组独立的监测数据的所述精确匹配字段有一个或者多个匹配度为O时,则判断所述两组独立的监测数据不属于同一个网络行为; 当模糊匹配字段总匹配度小于匹配阈值时,则判断所述两组独立的监测数据不属于同一个网络行为; 当...

【专利技术属性】
技术研发人员:欧阳佑费浩峻冯是聪吴明辉
申请(专利权)人:北京思博途信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1