一种微博网络用户影响力排名方法技术

技术编号:10403313 阅读:185 留言:0更新日期:2014-09-10 12:54
本发明专利技术公开了一种微博网络用户影响力排名方法,该方法首先收集用户参与在线社交的真实信息,包括用户微博数、粉丝数以及用户注册时间等,并基于以上信息计算出用户活跃度等;确定了用户活跃度之后,再进一步考虑用户的链接关系,将计算的活跃度应用到迭代和分配过程中,即在每次迭代之后,将当前节点的影响力按照所链出节点的活跃度进行加权分配并迭代计算,最终收敛到用户的影响力值。该方法能够实现动态的用户影响力排名,具有更好的公平性与准确性,能够更好的满足微博网络的复杂性和实时性的要求。

【技术实现步骤摘要】
一种微博网络用户影响力排名方法
本专利技术涉及微博网络中用户影响力的排名方法,属于数据挖掘

技术介绍
在社交网络迅速发展的今天,如何科学评价其成员在这一社会性媒体中的综合影响力,已形成一门新的学问,并将成为社会学研究的一项全新课题,也必将成为社会性媒体营销的一项重要指标。微博作为一种全新的社交媒介,在极短的时间里积聚了大量的用户,俨然已成为业界的热门研究主题。传统对微博用户影响力的研究都是借鉴网页排名方法,例如:PageRank、HITS(Hyperlink-InducedTopicSearch)等实现的一些静态方法,是在网页排名方法基础上引入用户好友关系、微博数量等要素进行方法排名,而并没有考虑到网络的动态发展过程。而本专利技术能够很好地解决上面的问题。
技术实现思路
本专利技术目的在于提供了一种微博网络用户影响力排名方法,该方法是基于时间因素,即TSNIRank(Time-basedSocialNetworkInfluenceRank)方法,该方法通过将用户参与微博活动的的情况与时间相结合,引入用户“活跃度”的概念,最后将用户“活跃度”作为影响力分配的因子来实现方法的迭代分配过程。与现有技术相比,本专利技术主要包括:首先,结合了微博网络的具体特征,将微博网络中用户之间关注关系、粉丝数、微博数等引入到传统的网页排名方法中。相对于PageRank等传统方法排名结果具有更高的覆盖人次,排名更加的公平和准确。其次,本专利技术引入了时间因素,对用户影响力从动态发展的角度进行衡量,更加符合微博网络的实时特性与演变特征。相对于传统未考虑时间的静态方法来说,能够更为精确的发掘当前的最具影响力用户,提高新用户的排名,降低不活跃老用户的排名,排名结果具有更好的现实意义与价值。本专利技术解决其技术问题所采用的技术方案是:本专利技术提供了一种基于时间因素的微博网络用户影响力排名方法,该方法将谷歌PageRank网页排名方法应用到微博网络之中,并根据用户在微博网络中的参与情况,结合了时间因素。方法流程:步骤1:采集用户参与在线社交的真实信息,再根据公式,计算出每个用户的活跃度;步骤2:将所有用户的影响力TSNIRank的初始值均设置为1/n,n为样本总用户数;步骤3:根据公式,计算每个用户的新的值;步骤4:将上述步骤3中的新的TSNIRank值作为下次迭代的初始值;步骤5:重复上述步骤3、4的计算过程,直到两次迭代之间的每个用户TSNIRank值之差的绝对值小于设定的一个很小的常数ε,表明计算结果已收敛。本专利技术所述方法的步骤1可分为两个步骤:首先需要采集到活跃度和方法相关的所有用户信息。用户信息的采集方法很多,可采用网络爬虫爬取、微博开放平台的API调用或者直接使用别人公开的开源数据集。用户参与在线社交的真实信息包括:用户粉丝数、发表微博数和用户注册时间;获取了相关数据之后,根据公式计算出用户的活跃度。其中P代表用户活跃度,f为粉丝数,w为微博数,Tc数据获取时间,Tr为用户微博账号的注册时间。用户活跃度可以反映用户自注册了微博账号以来的平均在线的活跃程度,如果用户的在线活动很少,那么随着时间的推移,用户的活跃度会逐渐下降,从而实现了用户影响力排名的一个动态的评价。本专利技术所述方法的步骤3和步骤4涉及的影响力迭代公式为:其中,I(u)为用户影响力,P为用户活跃度,B(u)为用户的所有链入关系集合,A(v)为用户v的所有链出关系集合,d为阻尼因子,为0-1之间的常数用来保证结果的收敛,在本方法中,d=0.85。本专利技术所述方法的步骤3将计算的用户活跃度P代入到影响力计算的迭代公式中:反复迭代直至结果收敛即为该方法的排名结果。本专利技术所述方法是结合用户静态的链接关系,将用户活跃度应用到迭代和分配过程中,即在每次迭代之后,将当前用户的影响力按照所链出节点的活跃度进行加权分配并迭代计算,直到收敛到稳定的用户影响力值。有益效果:1、本专利技术结合时间因素,利用用户的在线社交的频次与时间计算出用户活跃度,在迭代计算的过程中以用户活跃度为分配因子进行非均匀的迭代分配。2、本专利技术克服了PageRank单纯考虑链接关系的缺点,并引入时间的要素,能够实现动态的用户影响力排名,具有更好的公平性与准确性,能够更好的满足微博网络的复杂性和实时性的要求。附图说明图1为本专利技术的数据采集和解析系统示意图。图2为本专利技术的方法流程图。具体实施方式以下结合说明书附图对本专利技术创造作进一步的详细说明。如图1所示,本专利技术的系统主要分为采集系统和解析系统。采集系统负责按照一定的目标对微博网络(如Sina微博等)的服务器进行访问,将有用信息下载并存储;解析系统则根据研究的需要,对采集的数据格式进行相关的变换以适应不同的研究分析工具。系统的运作流程具体如下:(1)首先选取典型微博用户ID,然后将用户ID加入到任务队列中,根据需要,向服务器发送API请求以获取所需要的用户信息,如用户昵称、粉丝数、微博数、用户关注列表、互粉列表以及注册时间地点等的数据。(2)服务器返回的是JSON格式的数据流,再通过JSON数据解析模块,将数据以表的形式存储到SQL数据库中。(3)最后通过数据解析模块,对存储的数据进行相应的处理,获得用户之间的链路连接关系,以及与用户相关联的粉丝数、发表微博数、注册时间等信息。如图2所示,本专利技术是根据用户的在线社交的真实数据而计算出用户活跃度,在迭代计算的过程中以用户活跃度为分配因子进行非均匀的迭代分配。该方法克服了PageRank单纯考虑链接关系的缺点,并引入时间的要素,能够实现动态的用户影响力排名,具有更好的公平性与准确性,能够更好的满足微博网络的复杂性和实时性的要求,该方法具体的实施步骤如下:步骤1:原始数据采集数据的采集是方法实现最基础的环节,采集的方式有多种。鉴于目前的微博平台,如:新浪微博、腾讯微博都建立了自己的微博开放平台,可通过这些平台采取API调用方式来获取用户具体微博信息。例如:用户关注关系的API请求方法如下所示:请求方式:get请求URL:https://api.weibo.com/2/friendships/friends/ids.json请求参数:UID=2216755173&access_token=2.00Tz2LpBYxeb8Bc558101675xJjqEEUID的值代表当前请求所针对的用户。步骤2:用户活跃度计算将上述步骤1中采集的用户数据,利用公式计算出每个用户的活跃度。其中P代表用户活跃度,f为粉丝数,w为微博数,Tc数据获取时间,Tr为用户微博账号的注册时间,该公式反映了用户自注册微博以来的平均在线活跃情况。步骤3:影响力计算首先将所有用户的影响力TSNIRank的初始值均设置为1/n,n为样本总用户数,然后根据公式计算每个用户的影响力。步骤4:方法迭代将上述步骤3的计算结果作为下一次计算的初值反复根据上述公式进行迭代,直到两次迭代结果的差的绝对值小于一个很小的常数ε,终止迭代运算。可通过调整ε值来控制迭代的精度与次数。在迭代过程中,可利用矩阵的方法,将迭代公式转化为邻接关系矩阵的运算,以提高运算效率。本文档来自技高网...
一种微博网络用户影响力排名方法

【技术保护点】
一种微博网络用户影响力排名方法,其特征在于,所述方法;,包括如下步骤:步骤1:采集用户参与在线社交的真实信息,再根据公式,计算出每个用户的活跃度;步骤2:将所有用户的影响力TSNIRank的初始值均设置为1/n,n为样本总用户数;步骤3:根据公式,计算每个用户的新的值;步骤4:将上述步骤3中的新的TSNIRank值作为下次迭代的初始值;步骤5:重复上述步骤3、4的计算过程,直到两次迭代之间的每个用户TSNIRank值之差的绝对值小于设定的一个很小的常数ε,表明计算结果已收敛。

【技术特征摘要】
1.一种微博网络用户影响力排名方法,其特征在于,所述方法是基于时间因素,即TSNIRank(Time-basedSocialNetworkInfluenceRank)方法,所述方法通过将用户参与微博活动的的情况与时间相结合,引入用户“活跃度”的概念,最后将用户“活跃度”作为影响力分配的因子来实现方法的迭代分配过程,包括:首先,结合了微博网络的具体特征,将微博网络中用户之间关注关系、粉丝数、微博数等引入到传统的网页排名方法中,所述方法引入了时间因素,对用户影响力从动态发展的角度进行衡量,包括如下步骤:步骤1:采集用户参与在线社交的真实信息,再根据公式,计算出每个用户的活跃度,其计算公式为:其中P代表用户活跃度,f为粉丝数,w为微博数,Tc数据获取时间,Tr为用户微博账号的注册时间;步骤2:将所有用户的影响力TSNIRank的初始值均设置为1/n,n为样本总用户数;步骤3:根据公式,计算每个用户的新的值,将计算的用户活跃度P代入到影响力计算的迭代公式中:反复迭代直至结果收敛即为该方法的排名结果;步骤4:将上述步骤3中的新的TSNIRank值作为下次迭代的初始值,其影响力迭代公式为:

【专利技术属性】
技术研发人员:王玉峰卞京
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1