当前位置: 首页 > 专利查询>武汉大学专利>正文

微博平台上的僵尸用户探测方法技术

技术编号:8736066 阅读:233 留言:0更新日期:2013-05-26 12:04
本发明专利技术属于社交网络上可信度研究体系中的用户可信度的研究范畴,涉及一种微博平台上的僵尸用户探测方法,建立模型解决微博平台上的僵尸用户的探测问题,把僵尸用户的探测这一抽象的问题,与用户可信度的评估问题紧密的结合起来,通过建立起僵尸用户评估得分模型和僵尸用户概率判定模型,并且在僵尸用户概率划分模型中建立起一系列阈值,用于界定僵尸用户的级别。通过僵尸用户评估得分模型和僵尸用户概率判定模型的结合对微博平台上的用户一一进行僵尸用户的甄别。

【技术实现步骤摘要】

【技术保护点】
一种微博平台上的僵尸用户探测方法,其特征在于,包括以下步骤:步骤1,建立通配算子Z如下,Z=(Tw,Fr,Fa,Bf)其中,四个特征向量Tw,Fr,Fa,Bf表示四个影响因子,分别为微博数、关注数、收藏数和互粉数;步骤2,根据采用的影响因子,对用户计算通配算子Z对时间的一阶偏导数和二阶偏导数实现方式如下,采用的影响因子为微博数时,计算微博数变化率如下,Tw(Δ)=Tw(i)-Tw(j)t=Tw′其中,Tw(i)表示时刻i用户发表的微博数,Tw(j)表示时刻j用户发表的微博数,Tw′表示用户发表的微博数对时间的一阶导数,t表示时刻i与时刻j的时间差;计算微博数对时间的二阶导数如下,Tw′(Δ)=Tw′(i)-Tw′(j)t=Tw′′其中,Tw′(i)表示时刻i用户的微博数对时间的一阶导数,Tw′(j)表示时刻j用户的微博数对时间的一阶导数,Tw″表示用户的微博数对时间的二阶导数,t表示时刻i与时刻j的时间差;采用的影响因子为关注数时,计算关注数变化率如下,Fr(Δ)=Fr(i)-Fr(j)t=Fr′其中,Fr(i)表示时刻i用户的关注数,Fr(i)表示时刻j用户的关注数,Fr′表示用户的关注数对时间的一阶导数,t表示时刻i与时刻j的时间差;计算关注数对时间的二阶导数如下,Fr′(Δ)=Fr′(i)-Fr′(j)t=Fr′′其中,Fr′(i)表示时刻i用户的关注数对时间的一阶导数,Fr′(j)表示时刻j用户的关注数对时间的一阶导数,Fr″表示用户的关注数对时间的二阶导数,t表示时刻i与时刻j的时间差;采用的影响因子为收藏数时,计算收藏数变化率如下,Fa(Δ)=Fa(i)-Fa(j)t=Fa′其中,Fa(i)表示时刻i用户的收藏数,Fa(i)表示时刻j用户的收藏数,Fa′表示用户的收藏数对时间的一阶导数,t表示时刻i与时刻j的时间差;计算收藏数对时间的二阶导数如下,Fa′(Δ)=Fa′(i)-Fa′(j)t=Fa′′其中,Fa′(i)表示时刻i用户的收藏数对时间的一阶导数,Fa′(j)表示时刻j用户的收藏数对时间的一阶导数,Fa″表示用户的收藏数对时间的二阶导数,t表示时刻i与时刻j的时间差;采用的影响因子为互粉数时,计算互粉数变化率如下,Bf(Δ)=Bf(i)-Bf(j)t=Bf′其中,Bf(i)表示时刻i用户的互粉数,Bf(j)表示时刻j用户的互粉数,Bf′表示用户的互粉数对时间的一阶导数,t表示时刻i与时刻j的时间差;计算互粉数对时间的二阶导数如下,Bf′(Δ)=Bf′(i)-Bf′(j)t=Bf′′其中,Bf′(i)表示时刻i用户的互粉数对时间的一阶导数,Bf′(j)表示时刻j用户的互粉数对时间的一阶导数,Bf″表示用户的互粉数对时间的二阶导数,t表示时刻i与时刻j的时间差;步骤3,以时间为X轴、以影响因子为Y轴生成曲线,定义僵尸粉判别算子如下并进行计算,η=0Z′′=0∑Z′Z′′Z′′≠0η等于0时,表明用户从该时刻开始进入蛰伏期,当蛰伏期大于预设的阈值λ时,则认为该用户为僵尸粉的概率为100%;步骤4,定义曲线在某一时刻T的切线与X轴形成的夹角为θ,定义夹角θ的正弦值sinθ为该用户的活跃度得分,计算公式如下,S(T)=sinθ基于上述表达式,得出探测僵尸用户的探测模型如下,P(T)=(1?sinθ)×100%P(T)表示用户在某一时刻T被计算模型判定为僵尸用户的概率。FDA00002753364000011.jpg,FDA00002753364000012.jpg...

【技术特征摘要】

【专利技术属性】
技术研发人员:李石君王峰余伟甘琳杨莎王俊刘晶丁永刚
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1