一种批量非正常互动行为的识别方法及系统技术方案

技术编号:26890992 阅读:31 留言:0更新日期:2020-12-29 16:08
本发明专利技术实施例提供一种批量非正常互动行为的识别方法及系统,包括:获取前一监控周期内为某一待识别的网络活动发起的互动行为数量,当为该网络活动发起的互动行为数量大于预设数量阈值时,获取所有互动行为对应的发起时间点;统计自该网络活动发布时起每个固定的间隔时间段内为该网络活动发起的互动行为数量;对每一个间隔时间段及其对应的互动行为数量进行泊松分布的概率函数的拟合,得到为该网络活动发起的互动行为所对应的泊松分布的拟合系数和拟合优度;根据泊松分布的拟合系数和拟合优度判断为该网络活动发起的互动行为是否为批量非正常互动行为。通过基于柏松分布的概率函数识别某待识别的网络活动有无发生批量非正常互动行为现象。

【技术实现步骤摘要】
一种批量非正常互动行为的识别方法及系统
本专利技术涉及数据分析领域,具体涉及一种批量非正常互动行为的识别方法及系统。
技术介绍
在现代的社交媒体的互联网帐号中,点赞是一种非常重要的互动行为。于是出现大量不法分子利用脚本批量的刷赞,发起刷赞行为的用户就是刷赞用户。刷赞是对普通用户和对平台都不利的,要想办法找出来。通常采用统计点赞用户的每个ip的发起赞的数量n,通过阈值判断n>a实现。在实现本专利技术过程中,申请人发现现有技术中至少存在如下问题:在实际操作中,有些ip是小区出口ip,或者有些ip是机房ip,这种简单阈值判断极易误伤或者放过一部分刷赞。阈值a是极难确定的,需要人工经验定义。
技术实现思路
本专利技术实施例提供一种批量非正常互动行为的识别方法及系统,通过基于柏松分布的概率函数识别批量非正常互动行为,能够确定某待识别的网络活动有无发生批量非正常互动行为现象。为达上述目的,一方面,本专利技术实施例提供一种批量非正常互动行为的识别方法,包括:周期性获取前一监控周期内为某一待识别的网络活动发起的互动行为数量,当前一监控周期内为该网络活动发起的互动行为数量大于预设数量阈值时,自该网络活动发布时起获取所有互动行为对应的发起时间点;根据该网络活动的发布时间点、以及所有互动行为对应的发起时间点,统计自该网络活动发布时起每个固定的间隔时间段内为该网络活动发起的互动行为数量;对每一个间隔时间段及其对应的互动行为数量进行泊松分布的概率函数的拟合,得到为该网络活动发起的互动行为所对应的泊松分布的拟合系数和拟合优度,所述间隔时间段远远小于监控周期;根据泊松分布的拟合系数和拟合优度判断为该网络活动发起的互动行为是否为批量非正常互动行为,所述批量非正常互动行为是指参与该网络活动时利用脚本违规批量发起互动行为的网络行为。另一方面,本专利技术实施例提供一种批量非正常互动行为的识别系统,包括:获取单元,用于周期性获取前一监控周期内为某一待识别的网络活动发起的互动行为数量,当前一监控周期内为该网络活动发起的互动行为数量大于预设数量阈值时,自该网络活动发布时起获取所有互动行为对应的发起时间点;拟合单元,用于根据该网络活动的发布时间点、以及所有互动行为对应的发起时间点,统计自该网络活动发布时起每个固定的间隔时间段内为该网络活动发起的互动行为数量;对每一个间隔时间段及其对应的互动行为数量进行泊松分布的概率函数的拟合,得到为该网络活动发起的互动行为所对应的泊松分布的拟合系数和拟合优度,所述间隔时间段远远小于监控周期;判断单元,用于根据泊松分布的拟合系数和拟合优度判断为该网络活动发起的互动行为是否为批量非正常互动行为,所述批量非正常互动行为是指参与该网络活动时利用脚本违规批量发起互动行为的网络行为。上述技术方案具有如下有益效果:通过基于柏松分布的概率函数识别批量非正常互动行为,能够确定某待识别的网络活动有无发生批量非正常互动行为现象。而且能利用互动行为发起时间点这一信息来辅助决策,利用所有的互动行为信息,有效提高刷赞的拦截量,有效的降低对正常用户的误伤。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例的一种批量非正常互动行为的识别方法的流程图;图2是本专利技术实施例的一种批量非正常互动行为的识别系统的结构图;图3是为正常点赞微博的随预设相隔时间变化点赞量的直方图;图4是为刷赞微博的随预设相隔时间变化点赞量的直方图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,结合本专利技术的实施例,提供一种批量非正常互动行为的识别方法,包括:S101:周期性获取前一监控周期内为某一待识别的网络活动发起的互动行为数量,当前一监控周期内为该网络活动发起的互动行为数量大于预设数量阈值时,自该网络活动发布时起获取所有互动行为对应的发起时间点;S102:根据该网络活动的发布时间点、以及所有互动行为对应的发起时间点,统计自该网络活动发布时起每个固定的间隔时间段内为该网络活动发起的互动行为数量;对每一个间隔时间段及其对应的互动行为数量进行泊松分布的概率函数的拟合,得到为该网络活动发起的互动行为所对应的泊松分布的拟合系数和拟合优度,所述间隔时间段远远小于监控周期;S103:根据泊松分布的拟合系数和拟合优度判断为该网络活动发起的互动行为是否为批量非正常互动行为,所述批量非正常互动行为是指参与该网络活动时利用脚本违规批量发起互动行为的网络行为。优选地,网络活动的发布时间点、以及每一个互动行为的发起时间点采用时间戳表示;步骤102具体包括:S1021:将每一个互动行为的发起时间戳减去网络活动的发布时间戳,得到该网络活动的互动行为发起时间差列表;S1022:设置固定的间隔时间段,根据该网络活动的互动行为发起时间差列表、以及所述间隔时间段,统计得到每个固定的间隔时间段内为该网络活动发起的互动行为数量。优选地,步骤102具体包括:S1023:将每个固定的间隔时间段、各间隔时间段内的互动行为数量代入泊松分布的概率函数得到因变量;S1024:通过拟合软件根据各间隔时间段内的互动行为数量、各间隔时间段的起点到该网络活动发布时的时间间隔、因变量进行拟合,得到为该网络活动发起的互动行为对应的泊松分布的概率拟合曲线,并从所述泊松分布的概率拟合曲线中提取出拟合系数,根据拟合系数、以及拟合后的泊松分布的概率拟合曲线上的因变量得到泊松分布的拟合优度。优选地,步骤1023和1024之间还包括(即:在所述将每个固定的间隔时间段、各间隔时间段内的互动行为数量代入泊松分布的概率函数得到因变量之后,所述通过拟合软件根据各间隔时间段内的互动行为数量、各间隔时间段的起点到该网络活动发布时的时间间隔、因变量进行拟合之前,还包括):S1025:通过归一参数修正因变量,使得互动行为在其相应的间隔时间段出现的概率之和是1,以使拟合时使用的因变量为修正后的因变量。优选地,步骤103具体包括:S1031:当拟合优度小于第一预设值、且拟合系数大于第二预设值时,则判定该网络活动目前的互动行为为批量非正常互动行为;S1032:当拟合优度大于等于第一预设值、或者拟合系数小于等于第二预设值时,则判定该网络活动目前的互动行为为正常互动行为。如图1所示,结合本专利技术的实施例,提供一种批量非正常互动行为的识别系统,包括:获取单元21本文档来自技高网...

【技术保护点】
1.一种批量非正常互动行为的识别方法,其特征在于,包括:/n周期性获取前一监控周期内为某一待识别的网络活动发起的互动行为数量,当前一监控周期内为该网络活动发起的互动行为数量大于预设数量阈值时,自该网络活动发布时起获取所有互动行为对应的发起时间点;/n根据该网络活动的发布时间点、以及所有互动行为对应的发起时间点,统计自该网络活动发布时起每个固定的间隔时间段内为该网络活动发起的互动行为数量;对每一个间隔时间段及其对应的互动行为数量进行泊松分布的概率函数的拟合,得到为该网络活动发起的互动行为所对应的泊松分布的拟合系数和拟合优度,所述间隔时间段远远小于监控周期;/n根据泊松分布的拟合系数和拟合优度判断为该网络活动发起的互动行为是否为批量非正常互动行为,所述批量非正常互动行为是指参与该网络活动时利用脚本违规批量发起互动行为的网络行为。/n

【技术特征摘要】
1.一种批量非正常互动行为的识别方法,其特征在于,包括:
周期性获取前一监控周期内为某一待识别的网络活动发起的互动行为数量,当前一监控周期内为该网络活动发起的互动行为数量大于预设数量阈值时,自该网络活动发布时起获取所有互动行为对应的发起时间点;
根据该网络活动的发布时间点、以及所有互动行为对应的发起时间点,统计自该网络活动发布时起每个固定的间隔时间段内为该网络活动发起的互动行为数量;对每一个间隔时间段及其对应的互动行为数量进行泊松分布的概率函数的拟合,得到为该网络活动发起的互动行为所对应的泊松分布的拟合系数和拟合优度,所述间隔时间段远远小于监控周期;
根据泊松分布的拟合系数和拟合优度判断为该网络活动发起的互动行为是否为批量非正常互动行为,所述批量非正常互动行为是指参与该网络活动时利用脚本违规批量发起互动行为的网络行为。


2.根据权利要求1所述的批量非正常互动行为的识别方法,其特征在于,该网络活动的发布时间点、以及每一个互动行为的发起时间点采用时间戳表示;
所述根据该网络活动的发布时间点、以及所有互动行为对应的发起时间点,统计自该网络活动发布时起每个固定的间隔时间段内为该网络活动发起的互动行为数量,具体包括:
将每一个互动行为的发起时间戳减去网络活动的发布时间戳,得到该网络活动的互动行为发起时间差列表;
设置固定的间隔时间段,根据该网络活动的互动行为发起时间差列表、以及所述间隔时间段,统计得到每个固定的间隔时间段内为该网络活动发起的互动行为数量。


3.根据权利要求2所述的批量非正常互动行为的识别方法,其特征在于,所述对每一个间隔时间段及其对应的互动行为数量进行泊松分布的概率函数的拟合,得到为该网络活动发起的互动行为所对应的泊松分布的拟合系数和拟合优度,具体包括:
将每个固定的间隔时间段、各间隔时间段内的互动行为数量代入泊松分布的概率函数得到因变量;
通过拟合软件根据各间隔时间段内的互动行为数量、各间隔时间段的起点到该网络活动发布时的时间间隔、因变量进行拟合,得到为该网络活动发起的互动行为对应的泊松分布的概率拟合曲线,并从所述泊松分布的概率拟合曲线中提取出拟合系数,根据拟合系数、以及拟合后的泊松分布的概率拟合曲线上的因变量得到泊松分布的拟合优度。


4.根据权利要求3所述的批量非正常互动行为的识别方法,其特征在于,在所述将每个固定的间隔时间段、各间隔时间段内的互动行为数量代入泊松分布的概率函数得到因变量之后,所述通过拟合软件根据各间隔时间段内的互动行为数量、各间隔时间段的起点到该网络活动发布时的时间间隔、因变量进行拟合之前,还包括:
通过归一参数修正因变量,使得互动行为在其相应的间隔时间段出现的概率之和是1,以使拟合时使用的因变量为修正后的因变量。


5.根据权利要求3或4所述的批量非正常互动行为的识别方法,其特征在于,所述根据泊松分布的拟合系数和拟合优度判断为该网络活动发起的互动行为是否为批量非正常互动行为,具体包括:
当拟合优度小于第一预设值、且拟合系数大于第二预设值时,则判定该网络活动目前的...

【专利技术属性】
技术研发人员:王嘉伟
申请(专利权)人:微梦创科网络科技中国有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1