一种基于幂律分布确认刷赞用户的方法及装置制造方法及图纸

技术编号:26791283 阅读:25 留言:0更新日期:2020-12-22 17:06
本发明专利技术实施例提供一种基于幂律分布确认刷赞用户的方法及装置,实时获取当前时间之前的第一设定周期内为某网络活动发起点赞的IP以及各IP的点赞数量;并与当前的点赞阈值进行比对;当某个IP在第一设定周期内为该网络活动发起的点赞数量不小于当前的点赞阈值时,判定该IP为刷赞IP;采用幂律分布对为该网络活动发起点赞的IP数量以及各IP的点赞数量进行拟合,得到幂律分布拟合曲线,根据幂律分布拟合曲线得到该网络活动点赞数据的拟合优度;根据得到的该网络活动点赞数据的拟合优度修正当前的点赞阈值。通过对一定时间内点赞数量过高的网络活动进行数据挖掘,使用基于幂律分布对点赞数据进行分析,有效的降低对正常用户的误伤。

【技术实现步骤摘要】
一种基于幂律分布确认刷赞用户的方法及装置
本专利技术涉及数据分析领域,具体涉及一种基于幂律分布确认刷赞用户的方法及装置。
技术介绍
在现代的社交媒体的互联网帐号中,点赞是一种非常重要的互动行为。于是出现大量不法分子利用脚本批量的刷赞,发起刷赞行为的用户就是刷赞用户。刷赞是对普通用户和对平台都不利的,要想办法找出来。现有技术中,通过统计点赞用户的每个IP的发起赞的数量n,简单通过阈值判断n>a实现。在实现本专利技术过程中,申请人发现现有技术中至少存在如下问题:在实际操作中,有些IP是小区出口IP,或者有些IP是机房IP,这种简单阈值判断极易误伤或者放过一部分刷赞。阈值a是极难确定的,需要人工经验来定义。
技术实现思路
本专利技术实施例提供一种基于幂律分布确认刷赞用户的方法及装置,通过对一定时间内点赞数量过高的网络活动进行数据挖掘,使用基于幂律分布对点赞数据进行分析,自适应的自动调整拦截用户的点赞阈值有效提高刷赞的拦截量,有效的降低对正常用户的误伤。为达上述目的,一方面,本专利技术实施例提供一种基于幂律分布确认刷赞用户的方法,包括:针对具有互动性的网络活动,实时获取当前时间之前的第一设定周期内为该网络活动发起点赞的IP以及各IP的点赞数量;将每个IP在第一设定周期内为该网络活动发起的点赞数量与当前的点赞阈值进行比对;当某个IP在第一设定周期内为该网络活动发起的点赞数量不小于当前的点赞阈值时,判定该IP为刷赞IP,该刷赞IP所对应的用户为刷赞用户,所述刷赞IP是指参与该网络活动时违规批量点赞的IP;其中,所述点赞阈值通过如下方法周期性修正:周期性获取第二设定周期内为该网络活动发起的点赞总数;当在第二设定周期内为该网络活动发起的点赞总数大于第一预设值时,统计为该网络活动发起点赞的IP数量以及各IP的点赞数量;并采用幂律分布对为该网络活动发起点赞的IP数量以及各IP的点赞数量进行拟合,得到幂律分布拟合曲线,根据幂律分布拟合曲线得到该网络活动点赞数据的拟合优度;根据得到的该网络活动点赞数据的拟合优度修正当前的点赞阈值。另一方面,本专利技术实施例提供一种基于幂律分布确认刷赞用户的装置,包括:统计模块,用于针对具有互动性网络活动,实时获取当前时间之前的第一设定周期内为其发起点赞的IP以及各IP的点赞数量;比对模块,用于针对具有互动性的网络活动,实时获取当前时间之前的第一设定周期内为该网络活动发起点赞的IP以及各IP的点赞数量;比对模块,用于将每个IP在第一设定周期内为该网络活动发起的点赞数量与当前的点赞阈值进行比对;判定模块,用于当某个IP在第一设定周期内为该网络活动发起的点赞数量不小于当前的点赞阈值时,判定该IP为刷赞IP,该刷赞IP所对应的用户为刷赞用户,所述刷赞IP是指参与该网络活动时违规批量点赞的IP;阈值修正模块,用于周期性获取第二设定周期内为该网络活动发起的点赞总数;当在第二设定周期内为该网络活动发起的点赞总数大于第一预设值时,统计为该网络活动发起点赞的IP数量以及各IP的点赞数量;并采用幂律分布对为该网络活动发起点赞的IP数量以及各IP的点赞数量进行拟合,得到幂律分布拟合曲线,根据幂律分布拟合曲线得到该网络活动点赞数据的拟合优度;根据得到的该网络活动点赞数据的拟合优度修正当前的点赞阈值。上述技术方案具有如下有益效果:通过对一定时间内点赞数量过高的网络活动进行数据挖掘,使用基于幂律分布对点赞数据进行分析,自适应的自动调整拦截用户的点赞阈值,有效提高刷赞的拦截量,有效的降低对正常用户的误伤。从而实现动态拦截刷赞用户。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例的基于幂律分布确认刷赞用户的方法流程图;图2是本专利技术实施例的基于幂律分布确认刷赞用户的装置结构图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,结合本专利技术的实施例,提供一种基于幂律分布确认刷赞用户的方法,包括:S101:针对具有互动性的网络活动,实时获取当前时间之前的第一设定周期内为该网络活动发起点赞的IP以及各IP的点赞数量;S102:将每个IP在第一设定周期内为该网络活动发起的点赞数量与当前的点赞阈值进行比对;S103:当某个IP在第一设定周期内为该网络活动发起的点赞数量不小于当前的点赞阈值时,判定该IP为刷赞IP,该刷赞IP所对应的用户为刷赞用户,所述刷赞IP是指参与该网络活动时违规批量点赞的IP;S104:所述点赞阈值通过如下方法周期性修正:周期性获取第二设定周期内为该网络活动发起的点赞总数;当在第二设定周期内为该网络活动发起的点赞总数大于第一预设值时,统计为该网络活动发起点赞的IP数量以及各IP的点赞数量;并采用幂律分布对为该网络活动发起点赞的IP数量以及各IP的点赞数量进行拟合,得到幂律分布拟合曲线,根据幂律分布拟合曲线得到该网络活动点赞数据的拟合优度;根据得到的该网络活动点赞数据的拟合优度修正当前的点赞阈值。优选地,步骤104的“当在第二设定周期内为该网络活动发起的点赞总数大于第一预设值时,统计为该网络活动发起点赞的IP数量以及各IP的点赞数量”具体包括:S1041:在第二设定周期内为该网络活动发起的点赞总数大于第一预设值时,统计为该网络活动发起点赞的IP以及各IP的点赞数量,并形成该网络活动点赞数据的第一列表,所述第一列表包括多条点赞数据,每条点赞数据包括:点赞IP、以及该点赞IP所对应的点赞数量;S1042:将该网络活动点赞数据的第一列表进行数据转化,形成以各IP所发起的点赞数量为基准的该网络活动点赞数据的第二列表,所述第二列表用于幂律分布拟合,所述第二列表包括:每种点赞数量、以及该种点赞数量所对应的IP数量。优选地,步骤104的“采用幂律分布对为该网络活动发起点赞的IP数量以及各IP的点赞数量进行拟合,得到幂律分布拟合曲线,根据幂律分布拟合曲线得到该网络活动点赞数据的拟合优度”具体包括:S1043:将该网络活动点赞数据的第二列表的每种点赞数量作为幂律分布的自变量,以及将该种点赞数量所对应的IP数量作为幂律分布的因变量,得到该网络活动点赞数据的幂律分布拟合曲线,并从所述幂律分布拟合曲线中提取出幂律分布系数,根据幂律分布系数得到该网络活动点赞数据的拟合优度。优选地,步骤104的“根据得到的该网络活动点赞数本文档来自技高网...

【技术保护点】
1.一种基于幂律分布确认刷赞用户的方法,其特征在于,包括:/n针对具有互动性的网络活动,实时获取当前时间之前的第一设定周期内为该网络活动发起点赞的IP以及各IP的点赞数量;/n将每个IP在第一设定周期内为该网络活动发起的点赞数量与当前的点赞阈值进行比对;/n当某个IP在第一设定周期内为该网络活动发起的点赞数量不小于当前的点赞阈值时,判定该IP为刷赞IP,该刷赞IP所对应的用户为刷赞用户,所述刷赞IP是指参与该网络活动时违规批量点赞的IP;/n其中,所述点赞阈值通过如下方法周期性修正:/n周期性获取第二设定周期内为该网络活动发起的点赞总数;/n当在第二设定周期内为该网络活动发起的点赞总数大于第一预设值时,统计为该网络活动发起点赞的IP数量以及各IP的点赞数量;并/n采用幂律分布对为该网络活动发起点赞的IP数量以及各IP的点赞数量进行拟合,得到幂律分布拟合曲线,根据幂律分布拟合曲线得到该网络活动点赞数据的拟合优度;根据得到的该网络活动点赞数据的拟合优度修正当前的点赞阈值。/n

【技术特征摘要】
1.一种基于幂律分布确认刷赞用户的方法,其特征在于,包括:
针对具有互动性的网络活动,实时获取当前时间之前的第一设定周期内为该网络活动发起点赞的IP以及各IP的点赞数量;
将每个IP在第一设定周期内为该网络活动发起的点赞数量与当前的点赞阈值进行比对;
当某个IP在第一设定周期内为该网络活动发起的点赞数量不小于当前的点赞阈值时,判定该IP为刷赞IP,该刷赞IP所对应的用户为刷赞用户,所述刷赞IP是指参与该网络活动时违规批量点赞的IP;
其中,所述点赞阈值通过如下方法周期性修正:
周期性获取第二设定周期内为该网络活动发起的点赞总数;
当在第二设定周期内为该网络活动发起的点赞总数大于第一预设值时,统计为该网络活动发起点赞的IP数量以及各IP的点赞数量;并
采用幂律分布对为该网络活动发起点赞的IP数量以及各IP的点赞数量进行拟合,得到幂律分布拟合曲线,根据幂律分布拟合曲线得到该网络活动点赞数据的拟合优度;根据得到的该网络活动点赞数据的拟合优度修正当前的点赞阈值。


2.根据权利要求1所述的基于幂律分布确认刷赞用户的方法,其特征在于,所述当在第二设定周期内为该网络活动发起的点赞总数大于第一预设值时,统计为该网络活动发起点赞的IP数量以及各IP的点赞数量,具体包括:
当在第二设定周期内为该网络活动发起的点赞总数大于第一预设值时,统计为该网络活动发起点赞的IP以及各IP的点赞数量,并形成该网络活动点赞数据的第一列表,所述第一列表包括多条点赞数据,每条点赞数据包括:点赞IP、以及该点赞IP所对应的点赞数量;
将该网络活动点赞数据的第一列表进行数据转化,形成以各IP所发起的点赞数量为基准的该网络活动点赞数据的第二列表,所述第二列表用于幂律分布拟合,所述第二列表包括:每种点赞数量、以及该种点赞数量所对应的IP数量。


3.根据权利要求2所述的基于幂律分布确认刷赞用户的方法,其特征在于,所述采用幂律分布对为该网络活动发起点赞的IP数量以及各IP的点赞数量进行拟合,得到幂律分布拟合曲线,根据幂律分布拟合曲线得到该网络活动点赞数据的拟合优度,具体包括:
将该网络活动点赞数据的第二列表的每种点赞数量作为幂律分布的自变量,以及将该种点赞数量所对应的IP数量作为幂律分布的因变量,得到该网络活动点赞数据的幂律分布拟合曲线,并从所述幂律分布拟合曲线中提取出幂律分布系数,根据幂律分布系数得到该网络活动点赞数据的拟合优度。


4.根据权利要求3所述的基于幂律分布确认刷赞用户的方法,其特征在于,所述根据得到的该网络活动点赞数据的拟合优度修正当前的点赞阈值,具体包括:
使用该网络活动点赞数据的拟合优度与预设的点赞阈值之积修正当前的点赞阈值。


5.根据权利要求3所述的基于幂律分布确认刷赞用户的方法,其特征在于,所述根据该网络活动点赞数据的拟合优度修正当前的点赞阈值,具体包括:
判断该网络活动点赞数据的拟合优度是否小于第二预设值;
当该网络活动点赞数据的拟合优度小于第二预设值时,使用该网络活动点赞数据的拟合优度与预设的点赞阈值...

【专利技术属性】
技术研发人员:王嘉伟
申请(专利权)人:微梦创科网络科技中国有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1