基于屏幕操作特征的流量作弊识别方法及装置制造方法及图纸

技术编号:38427871 阅读:9 留言:0更新日期:2023-08-07 11:25
本申请提供了基于屏幕操作特征的流量作弊识别方法及装置,选取滑动距离、点击坐标、新闻浏览时长、视频观看时长和行为时间间隔作为行为数据的多个观测维度,每个观测维度对应有至少两个指标,通过采集用户每次浏览新闻或观看视频时对应的多个维度的行为数据,计算其对应指标的指标值,根据指标值确定是否存在异常指标,根据异常指标的个数综合判定是否为作弊流量。本发明专利技术可以根据屏幕点击、滑动等行为的衍生特征,识别用户的流量是否为使用自动阅读脚本产生的作弊流量。本发明专利技术通过多维度的行为数据的特征来判定作弊流量,能够提高作弊流量识别的准确性。识别的准确性。识别的准确性。

【技术实现步骤摘要】
基于屏幕操作特征的流量作弊识别方法及装置


[0001]本专利技术涉及流量监控
,尤其涉及一种基于屏幕操作特征的流量作弊识别方法。

技术介绍

[0002]流量作弊也叫刷量,是指通过作弊脚本模仿正常用户针对特定网站或网页进行持续大量的访问,不断刷新提高该网站或网页的数据流量,从而借机牟取不法利益。例如,在手机中植入一个脚本程序,使用脚本去替代人工、模拟人工去全自动化阅读,脚本自动完成签到、自动浏览新闻或观看视频、自动跳转。
[0003]目前针对流量作弊的监测与识别,大多通过监测在网页页面上发生的点击操作来确定这些操作是否为流量作弊操作,从而确定出是否发生流量作弊。但随着流量作弊手段的越来越丰富,作弊脚本已经可以将点击操作模拟到越来越贴近于用户的实际操作,故单纯通过分析点击操作已经越来越难以准确地确定是否发生流量作弊。

技术实现思路

[0004]本专利技术的目的在于提供一种基于屏幕操作特征的流量作弊识别方法,通过屏幕点击、滑动等多种行为的衍生特征,更准确地识别自动阅读脚本作弊,以解决上述技术背景中提出的问题。
[0005]为实现上述目的,本专利技术采用以下技术方案:
[0006]第一个方面,本专利技术提供了一种基于屏幕操作特征的流量作弊识别方法,包括:
[0007]在用户终端加载显示网页页面后,获取设定时间段内对象在网页页面的行为数据,并从所述行为数据中获取每个行为的发生次数,行为数据包括滑动距离、点击坐标、新闻浏览时长、视频观看时长和行为时间间隔;
[0008]计算每个行为数据对应指标的指标值;
[0009]对各指标值进行分析,确定异常指标值的个数;
[0010]根据异常指标值的个数,判定该用户终端的流量是否为使用自动阅读脚本产生的作弊流量;
[0011]其中,所述行为数据对应的指标包括滑动距离相同的滑动次数占比、滑动距离的变异系数、点击坐标相同的点击次数占比、点击坐标的变异系数、浏览时长相同的新闻条数占比、浏览时长的变异系数、观看时长相同的视频条数占比、观看时长的变异系数、行为时间间隔相同的次数占比、行为时间间隔的变异系数中的一种或几种的组合。
[0012]在一种优选实施例中,所述对各指标值进行分析,确定异常指标值的个数,包括如下步骤:
[0013]每个指标对应有预设阈值;
[0014]将每个指标值与其对应的预设阈值分别进行比较,确定该指标值是否异常;
[0015]统计所有指标值异常的个数。
[0016]在一种优选实施例中,所述根据异常指标值的个数,判定该用户终端的流量为使用自动阅读脚本产生的作弊流量,包括如下步骤:
[0017]将异常指标值的个数与异常阈值进行比较,若异常指标值的个数大于或等于该异常阈值,则确定该用户终端的行为是流量作弊操作,反之,则确定该用户终端的行为不是流量作弊操作;或者,
[0018]计算异常指标值的个数在指标总个数中的占比,若占比大于或等于预设比例阈值,则确定该用户终端的行为是流量作弊操作,反之,则确定该用户终端的行为不是流量作弊操作。
[0019]在一种优选实施例中,所述行为数据为滑动距离时,所述方法包括如下步骤:
[0020]确定当日滑动距离相同的滑动次数在当日总滑动次数的占比,得到所述滑动距离相同的滑动次数占比;
[0021]判断所述滑动距离相同的滑动次数占比是否大于或等于第一预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值;
[0022]和/或
[0023]确定当日滑动距离标准差在当日滑动距离平均值的占比,得到所述滑动距离的变异系数;
[0024]判断所述滑动距离的变异系数是否小于第二预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值。
[0025]在一种优选实施例中,所述行为数据为点击坐标时,所述方法包括如下步骤:
[0026]确定当日点击坐标相同的点击次数在当日总点击次数的占比,得到所述点击坐标相同的点击次数占比;
[0027]判断所述点击坐标相同的点击次数占比是否大于或等于第三预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值;
[0028]和/或
[0029]确定当日点击X轴坐标标准差在当日点击X轴坐标平均值的占比,得到点击坐标于X轴的变异系数;
[0030]判断所述点击坐标于X轴的变异系数是否小于第四预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值;
[0031]和/或
[0032]确定当日点击Y轴坐标标准差在当日点击Y轴坐标平均值的占比,得到点击坐标于Y轴的变异系数;
[0033]判断所述点击坐标于Y轴的变异系数是否小于第五预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值。
[0034]在一种优选实施例中,所述行为数据为新闻浏览时长时,所述方法包括如下步骤:
[0035]确定当日点浏览时长相同的新闻条数在当日总浏览新闻条数的占比,得到所述浏览时长相同的新闻条数占比;
[0036]判断所述浏览时长相同的新闻条数占比是否大于或等于第六预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值;
[0037]和/或
[0038]确定当日每条新闻浏览时长标准差在当日每条新闻平均浏览时长的占比,得到浏览时长的变异系数;
[0039]判断所述浏览时长的变异系数是否小于第七预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值。
[0040]在一种优选实施例中,所述行为数据为视频观看时长时,所述方法包括如下步骤:
[0041]确定当日点观看时长相同的视频条数在当日总观看视频条数的占比,得到所述观看时长相同的视频条数占比;
[0042]判断所述观看时长相同的视频条数占比是否大于或等于第八预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值;
[0043]和/或
[0044]确定当日每条视频观看时长标准差在当日每条视频平均观看时长的占比,得到观看时长的变异系数;
[0045]判断所述观看时长的变异系数是否小于第九预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值。
[0046]在一种优选实施例中,所述行为数据为行为时间间隔时,所述方法包括如下步骤:
[0047]确定当日行为时间间隔相同的次数在当日总行为次数减1中的占比,得到所述行为时间间隔相同的次数占比;
[0048]判断所述行为时间间隔相同的次数占比是否大于或等于第十预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值;
[0049]和/或
[0050]确定当日行为时间间隔标准差在当日行为时间间隔平均值的占比,得到行为时间间隔的变异系数;
[0051]判断所述行为时间间隔的变异系数是否小于第十一预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值。
[0052]在一种优选实施例中,所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于屏幕操作特征的流量作弊识别方法,其特征在于,包括:在用户终端加载显示网页页面后,获取设定时间段内对象在网页页面的行为数据,并从所述行为数据中获取每个行为的发生次数,行为数据包括滑动距离、点击坐标、新闻浏览时长、视频观看时长和行为时间间隔;基于各行为数据分别生成多个衍生指标,其中,滑动距离的衍生指标包括滑动距离相同的滑动次数占比、滑动距离的变异系数,点击坐标的衍生指标包括点击坐标相同的点击次数占比、点击坐标的变异系数,新闻浏览时长的衍生指标包括浏览时长相同的新闻条数占比、浏览时长的变异系数,视频观看时长的衍生指标包括观看时长相同的视频条数占比、观看时长的变异系数,行为时间间隔的衍生指标包括行为时间间隔相同的次数占比、行为时间间隔的变异系数;计算每个行为数据对应的衍生指标的指标值;每个衍生指标对应有预设阈值,将每个衍生指标的指标值与其对应的预设阈值分别进行比较,确定该指标值是否异常;统计所有指标值异常的个数,确定异常指标值的总个数;将异常指标值的总个数与异常阈值进行比较,若异常指标值的总个数大于或等于该异常阈值,则确定该用户终端的行为是流量作弊操作,反之,则确定该用户终端的行为不是流量作弊操作;或者,计算异常指标值的总个数在指标总个数中的占比,若占比大于或等于预设比例阈值,则确定该用户终端的行为是流量作弊操作,反之,则确定该用户终端的行为不是流量作弊操作。2.根据权利要求1所述的基于屏幕操作特征的流量作弊识别方法,其特征在于,所述行为数据为滑动距离时,所述方法包括如下步骤:确定当日滑动距离相同的滑动次数在当日总滑动次数的占比,得到所述滑动距离相同的滑动次数占比;判断所述滑动距离相同的滑动次数占比是否大于或等于第一预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值;以及确定当日滑动距离标准差在当日滑动距离平均值的占比,得到所述滑动距离的变异系数;判断所述滑动距离的变异系数是否小于第二预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值。3.根据权利要求1所述的基于屏幕操作特征的流量作弊识别方法,其特征在于,所述行为数据为点击坐标时,所述方法包括如下步骤:确定当日点击坐标相同的点击次数在当日总点击次数的占比,得到所述点击坐标相同的点击次数占比;判断所述点击坐标相同的点击次数占比是否大于或等于第三预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值;以及确定当日点击X轴坐标标准差在当日点击X轴坐标平均值的占比,得到点击坐标于X轴
的变异系数;判断所述点击坐标于X轴的变异系数是否小于第四预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值;以及确定当日点击Y轴坐标标准差在当日点击Y轴坐标平均值的占比,得到点击坐标于Y轴的变异系数;判断所述点击坐标于Y轴的变异系数是否小于第五预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值。4.根据权利要求1所述的基于屏幕操作特征的流量作弊识别方法,其特征在于,所述行为数据为新闻浏览时长时,所述方法包括如下步骤:确定当日点浏览时长相同的新闻条数在当日总浏览新闻条数的占比,得到所述浏览时长相同的新闻条数占比;判断所述浏览时长相同的新闻条数占比是否大于或等于第六预设阈值,若是,则判定为异常指标值,反之,则判定为正常指标值;以及确定当日每条新闻浏览时长标准差在当日每...

【专利技术属性】
技术研发人员:顾骏伟
申请(专利权)人:上海二三四五网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1