【技术实现步骤摘要】
基于屏幕操作特征的流量作弊识别方法及装置
[0001]本专利技术涉及流量监控
,尤其涉及一种基于屏幕操作特征的流量作弊识别方法。
技术介绍
[0002]流量作弊也叫刷量,是指通过作弊脚本模仿正常用户针对特定网站或网页进行持续大量的访问,不断刷新提高该网站或网页的数据流量,从而借机牟取不法利益。例如,在手机中植入一个脚本程序,使用脚本去替代人工、模拟人工去全自动化阅读,脚本自动完成签到、自动浏览新闻或观看视频、自动跳转。
[0003]目前针对流量作弊的监测与识别,大多通过监测在网页页面上发生的点击操作来确定这些操作是否为流量作弊操作,从而确定出是否发生流量作弊。但随着流量作弊手段的越来越丰富,作弊脚本已经可以将点击操作模拟到越来越贴近于用户的实际操作,故单纯通过分析点击操作已经越来越难以准确地确定是否发生流量作弊。
技术实现思路
[0004]本专利技术的目的在于提供一种基于屏幕操作特征的流量作弊识别方法,通过屏幕点击、滑动等多种行为的衍生特征,更准确地识别自动阅读脚本作弊,以解决上述技术背景中提出的问题。
[0005]为实现上述目的,本专利技术采用以下技术方案:
[0006]第一个方面,本专利技术提供了一种基于屏幕操作特征的流量作弊识别方法,包括:
[0007]在用户终端加载显示网页页面后,获取设定时间段内对象在网页页面的行为数据,并从所述行为数据中获取每个行为的发生次数,行为数据包括滑动距离、点击坐标、新闻浏览时长、视频观看时长和行为时间间隔;
[0008 ...
【技术保护点】
【技术特征摘要】
1.基于屏幕操作特征的流量作弊识别方法,其特征在于,包括:在用户终端加载显示网页页面后,获取设定时间段内对象在网页页面的行为数据,并从所述行为数据中获取每个行为的发生次数,行为数据包括滑动距离、点击坐标、新闻浏览时长、视频观看时长和行为时间间隔;基于各行为数据分别生成多个衍生指标,其中,滑动距离的衍生指标包括滑动距离相同的滑动次数占比、滑动距离的变异系数,点击坐标的衍生指标包括点击坐标相同的点击次数占比、点击坐标的变异系数,新闻浏览时长的衍生指标包括浏览时长相同的新闻条数占比、浏览时长的变异系数,视频观看时长的衍生指标包括观看时长相同的视频条数占比、观看时长的变异系数,行为时间间隔的衍生指标包括行为时间间隔相同的次数占比、行为时间间隔的变异系数;计算每个行为数据对应的衍生指标的指标值;每个衍生指标对应有预设阈值,将每个衍生指标的指标值与其对应的预设阈值分别进行比较,确定该指标值是否异常;统计所有指标值异常的个数,确定异常指标值的总个数;将异常指标值的总个数与异常阈值进行比较,若异常指标值的总个数大于或等于该异常阈值,则确定该用户终端的行为是流量作弊操作,反之,则确定该用户终端的行为不是流量作弊操作;或者,计算异常指标值的总个数在指标总个数中的占比,若占比大于或等于预设比例阈值,则确定该用户终端的行为是流量作弊操作,反之,则确定该用户终端的行为不是流量作弊操作。2.根据权利要求1所述的基于屏幕操作特征的流量作弊识别方法,其特征在于,所述行为数据为滑动距离时,所述方法包括如下步骤:确定当日滑动距离相同的滑动次数在当日总滑动次数的占比,得到所述滑动距离相同的滑动次数占比;判断所述滑动距离相同的滑动次数占比是否大于或等于第一预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值;以及确定当日滑动距离标准差在当日滑动距离平均值的占比,得到所述滑动距离的变异系数;判断所述滑动距离的变异系数是否小于第二预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值。3.根据权利要求1所述的基于屏幕操作特征的流量作弊识别方法,其特征在于,所述行为数据为点击坐标时,所述方法包括如下步骤:确定当日点击坐标相同的点击次数在当日总点击次数的占比,得到所述点击坐标相同的点击次数占比;判断所述点击坐标相同的点击次数占比是否大于或等于第三预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值;以及确定当日点击X轴坐标标准差在当日点击X轴坐标平均值的占比,得到点击坐标于X轴
的变异系数;判断所述点击坐标于X轴的变异系数是否小于第四预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值;以及确定当日点击Y轴坐标标准差在当日点击Y轴坐标平均值的占比,得到点击坐标于Y轴的变异系数;判断所述点击坐标于Y轴的变异系数是否小于第五预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值。4.根据权利要求1所述的基于屏幕操作特征的流量作弊识别方法,其特征在于,所述行为数据为新闻浏览时长时,所述方法包括如下步骤:确定当日点浏览时长相同的新闻条数在当日总浏览新闻条数的占比,得到所述浏览时长相同的新闻条数占比;判断所述浏览时长相同的新闻条数占比是否大于或等于第六预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值;以及确定当日每条新闻浏览时长标准差在当日每...
【专利技术属性】
技术研发人员:顾骏伟,
申请(专利权)人:上海二三四五网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。