【技术实现步骤摘要】
一种批量非正常互动行为的识别方法及系统
本专利技术涉及数据分析领域,具体涉及一种批量非正常互动行为的识别方法及系统。
技术介绍
在现代的社交媒体的互联网帐号中,点赞是一种非常重要的互动行为。于是出现大量不法分子利用脚本批量的刷赞,发起刷赞行为的用户就是刷赞用户。刷赞是对普通用户和对平台都不利的,要想办法找出来。通常采用统计点赞用户的每个ip的发起赞的数量n,通过阈值判断n>a实现。在实现本专利技术过程中,申请人发现现有技术中至少存在如下问题:在实际操作中,有些ip是小区出口ip,或者有些ip是机房ip,这种简单阈值判断极易误伤或者放过一部分刷赞。阈值a是极难确定的,需要人工经验定义。
技术实现思路
本专利技术实施例提供一种批量非正常互动行为的识别方法及系统,通过基于柏松分布的概率函数识别批量非正常互动行为,能够确定某待识别的网络活动有无发生批量非正常互动行为现象。为达上述目的,一方面,本专利技术实施例提供一种批量非正常互动行为的识别方法,包括:周期性获取前一监控周期内为某一待识别的网络活动发起的互动行为数量,当前一监控周期内为该网络活动发起的互动行为数量大于预设数量阈值时,自该网络活动发布时起获取所有互动行为对应的发起时间点;根据该网络活动的发布时间点、以及所有互动行为对应的发起时间点,统计自该网络活动发布时起每个固定的间隔时间段内为该网络活动发起的互动行为数量;对每一个间隔时间段及其对应的互动行为数量进行泊松分布的概率函数的拟合,得到为该网络活动发起的互动行 ...
【技术保护点】
1.一种批量非正常互动行为的识别方法,其特征在于,包括:/n周期性获取前一监控周期内为某一待识别的网络活动发起的互动行为数量,当前一监控周期内为该网络活动发起的互动行为数量大于预设数量阈值时,自该网络活动发布时起获取所有互动行为对应的发起时间点;/n根据该网络活动的发布时间点、以及所有互动行为对应的发起时间点,统计自该网络活动发布时起每个固定的间隔时间段内为该网络活动发起的互动行为数量;对每一个间隔时间段及其对应的互动行为数量进行泊松分布的概率函数的拟合,得到为该网络活动发起的互动行为所对应的泊松分布的拟合系数和拟合优度,所述间隔时间段远远小于监控周期;/n根据泊松分布的拟合系数和拟合优度判断为该网络活动发起的互动行为是否为批量非正常互动行为,所述批量非正常互动行为是指参与该网络活动时利用脚本违规批量发起互动行为的网络行为。/n
【技术特征摘要】
1.一种批量非正常互动行为的识别方法,其特征在于,包括:
周期性获取前一监控周期内为某一待识别的网络活动发起的互动行为数量,当前一监控周期内为该网络活动发起的互动行为数量大于预设数量阈值时,自该网络活动发布时起获取所有互动行为对应的发起时间点;
根据该网络活动的发布时间点、以及所有互动行为对应的发起时间点,统计自该网络活动发布时起每个固定的间隔时间段内为该网络活动发起的互动行为数量;对每一个间隔时间段及其对应的互动行为数量进行泊松分布的概率函数的拟合,得到为该网络活动发起的互动行为所对应的泊松分布的拟合系数和拟合优度,所述间隔时间段远远小于监控周期;
根据泊松分布的拟合系数和拟合优度判断为该网络活动发起的互动行为是否为批量非正常互动行为,所述批量非正常互动行为是指参与该网络活动时利用脚本违规批量发起互动行为的网络行为。
2.根据权利要求1所述的批量非正常互动行为的识别方法,其特征在于,该网络活动的发布时间点、以及每一个互动行为的发起时间点采用时间戳表示;
所述根据该网络活动的发布时间点、以及所有互动行为对应的发起时间点,统计自该网络活动发布时起每个固定的间隔时间段内为该网络活动发起的互动行为数量,具体包括:
将每一个互动行为的发起时间戳减去网络活动的发布时间戳,得到该网络活动的互动行为发起时间差列表;
设置固定的间隔时间段,根据该网络活动的互动行为发起时间差列表、以及所述间隔时间段,统计得到每个固定的间隔时间段内为该网络活动发起的互动行为数量。
3.根据权利要求2所述的批量非正常互动行为的识别方法,其特征在于,所述对每一个间隔时间段及其对应的互动行为数量进行泊松分布的概率函数的拟合,得到为该网络活动发起的互动行为所对应的泊松分布的拟合系数和拟合优度,具体包括:
将每个固定的间隔时间段、各间隔时间段内的互动行为数量代入泊松分布的概率函数得到因变量;
通过拟合软件根据各间隔时间段内的互动行为数量、各间隔时间段的起点到该网络活动发布时的时间间隔、因变量进行拟合,得到为该网络活动发起的互动行为对应的泊松分布的概率拟合曲线,并从所述泊松分布的概率拟合曲线中提取出拟合系数,根据拟合系数、以及拟合后的泊松分布的概率拟合曲线上的因变量得到泊松分布的拟合优度。
4.根据权利要求3所述的批量非正常互动行为的识别方法,其特征在于,在所述将每个固定的间隔时间段、各间隔时间段内的互动行为数量代入泊松分布的概率函数得到因变量之后,所述通过拟合软件根据各间隔时间段内的互动行为数量、各间隔时间段的起点到该网络活动发布时的时间间隔、因变量进行拟合之前,还包括:
通过归一参数修正因变量,使得互动行为在其相应的间隔时间段出现的概率之和是1,以使拟合时使用的因变量为修正后的因变量。
5.根据权利要求3或4所述的批量非正常互动行为的识别方法,其特征在于,所述根据泊松分布的拟合系数和拟合优度判断为该网络活动发起的互动行为是否为批量非正常互动行为,具体包括:
当拟合优度小于第一预设值、且拟合系数大于第二预设值时,则判定该网络活动目前的...
【专利技术属性】
技术研发人员:王嘉伟,
申请(专利权)人:微梦创科网络科技中国有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。