【技术实现步骤摘要】
一种基于幂律分布确认刷赞用户的方法及装置
本专利技术涉及数据分析领域,具体涉及一种基于幂律分布确认刷赞用户的方法及装置。
技术介绍
在现代的社交媒体的互联网帐号中,点赞是一种非常重要的互动行为。于是出现大量不法分子利用脚本批量的刷赞,发起刷赞行为的用户就是刷赞用户。刷赞是对普通用户和对平台都不利的,要想办法找出来。现有技术中,通过统计点赞用户的每个IP的发起赞的数量n,简单通过阈值判断n>a实现。在实现本专利技术过程中,申请人发现现有技术中至少存在如下问题:在实际操作中,有些IP是小区出口IP,或者有些IP是机房IP,这种简单阈值判断极易误伤或者放过一部分刷赞。阈值a是极难确定的,需要人工经验来定义。
技术实现思路
本专利技术实施例提供一种基于幂律分布确认刷赞用户的方法及装置,通过对一定时间内点赞数量过高的网络活动进行数据挖掘,使用基于幂律分布对点赞数据进行分析,自适应的自动调整拦截用户的点赞阈值有效提高刷赞的拦截量,有效的降低对正常用户的误伤。为达上述目的,一方面,本专利技术实施例提供一种基于幂律分布确认刷赞用户的方法,包括:针对具有互动性的网络活动,实时获取当前时间之前的第一设定周期内为该网络活动发起点赞的IP以及各IP的点赞数量;将每个IP在第一设定周期内为该网络活动发起的点赞数量与当前的点赞阈值进行比对;当某个IP在第一设定周期内为该网络活动发起的点赞数量不小于当前的点赞阈值时,判定该IP为刷赞IP,该刷赞IP所对应的用户为刷赞用户,所 ...
【技术保护点】
1.一种基于幂律分布确认刷赞用户的方法,其特征在于,包括:/n针对具有互动性的网络活动,实时获取当前时间之前的第一设定周期内为该网络活动发起点赞的IP以及各IP的点赞数量;/n将每个IP在第一设定周期内为该网络活动发起的点赞数量与当前的点赞阈值进行比对;/n当某个IP在第一设定周期内为该网络活动发起的点赞数量不小于当前的点赞阈值时,判定该IP为刷赞IP,该刷赞IP所对应的用户为刷赞用户,所述刷赞IP是指参与该网络活动时违规批量点赞的IP;/n其中,所述点赞阈值通过如下方法周期性修正:/n周期性获取第二设定周期内为该网络活动发起的点赞总数;/n当在第二设定周期内为该网络活动发起的点赞总数大于第一预设值时,统计为该网络活动发起点赞的IP数量以及各IP的点赞数量;并/n采用幂律分布对为该网络活动发起点赞的IP数量以及各IP的点赞数量进行拟合,得到幂律分布拟合曲线,根据幂律分布拟合曲线得到该网络活动点赞数据的拟合优度;根据得到的该网络活动点赞数据的拟合优度修正当前的点赞阈值。/n
【技术特征摘要】
1.一种基于幂律分布确认刷赞用户的方法,其特征在于,包括:
针对具有互动性的网络活动,实时获取当前时间之前的第一设定周期内为该网络活动发起点赞的IP以及各IP的点赞数量;
将每个IP在第一设定周期内为该网络活动发起的点赞数量与当前的点赞阈值进行比对;
当某个IP在第一设定周期内为该网络活动发起的点赞数量不小于当前的点赞阈值时,判定该IP为刷赞IP,该刷赞IP所对应的用户为刷赞用户,所述刷赞IP是指参与该网络活动时违规批量点赞的IP;
其中,所述点赞阈值通过如下方法周期性修正:
周期性获取第二设定周期内为该网络活动发起的点赞总数;
当在第二设定周期内为该网络活动发起的点赞总数大于第一预设值时,统计为该网络活动发起点赞的IP数量以及各IP的点赞数量;并
采用幂律分布对为该网络活动发起点赞的IP数量以及各IP的点赞数量进行拟合,得到幂律分布拟合曲线,根据幂律分布拟合曲线得到该网络活动点赞数据的拟合优度;根据得到的该网络活动点赞数据的拟合优度修正当前的点赞阈值。
2.根据权利要求1所述的基于幂律分布确认刷赞用户的方法,其特征在于,所述当在第二设定周期内为该网络活动发起的点赞总数大于第一预设值时,统计为该网络活动发起点赞的IP数量以及各IP的点赞数量,具体包括:
当在第二设定周期内为该网络活动发起的点赞总数大于第一预设值时,统计为该网络活动发起点赞的IP以及各IP的点赞数量,并形成该网络活动点赞数据的第一列表,所述第一列表包括多条点赞数据,每条点赞数据包括:点赞IP、以及该点赞IP所对应的点赞数量;
将该网络活动点赞数据的第一列表进行数据转化,形成以各IP所发起的点赞数量为基准的该网络活动点赞数据的第二列表,所述第二列表用于幂律分布拟合,所述第二列表包括:每种点赞数量、以及该种点赞数量所对应的IP数量。
3.根据权利要求2所述的基于幂律分布确认刷赞用户的方法,其特征在于,所述采用幂律分布对为该网络活动发起点赞的IP数量以及各IP的点赞数量进行拟合,得到幂律分布拟合曲线,根据幂律分布拟合曲线得到该网络活动点赞数据的拟合优度,具体包括:
将该网络活动点赞数据的第二列表的每种点赞数量作为幂律分布的自变量,以及将该种点赞数量所对应的IP数量作为幂律分布的因变量,得到该网络活动点赞数据的幂律分布拟合曲线,并从所述幂律分布拟合曲线中提取出幂律分布系数,根据幂律分布系数得到该网络活动点赞数据的拟合优度。
4.根据权利要求3所述的基于幂律分布确认刷赞用户的方法,其特征在于,所述根据得到的该网络活动点赞数据的拟合优度修正当前的点赞阈值,具体包括:
使用该网络活动点赞数据的拟合优度与预设的点赞阈值之积修正当前的点赞阈值。
5.根据权利要求3所述的基于幂律分布确认刷赞用户的方法,其特征在于,所述根据该网络活动点赞数据的拟合优度修正当前的点赞阈值,具体包括:
判断该网络活动点赞数据的拟合优度是否小于第二预设值;
当该网络活动点赞数据的拟合优度小于第二预设值时,使用该网络活动点赞数据的拟合优度与预设的点赞阈值...
【专利技术属性】
技术研发人员:王嘉伟,
申请(专利权)人:微梦创科网络科技中国有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。