一种学术社交网络中魔力研究社区的排序方法技术

技术编号:13672432 阅读:45 留言:0更新日期:2016-09-07 20:42
本发明专利技术公开了一种学术社交网络中魔力研究社区的排序方法,属于数据挖掘技术领域。所述排序方法中,给定一个时间窗口,在学术社交网络中发现魔力研究社区;所述的魔力研究社区是那些逐渐开始流行的有吸引力的研究社区。具体包括研究社区内部特征计算、外部特征FE计算和排序的步骤。本发明专利技术可帮助研究人员更好地了解和把握当前的研究趋势和热点;突破了现有研究中的假设,即一个人在一个时刻只处于一个社区;抽取了魔力研究社区的特征,并设计了统一的算法对研究社区的潜在流行程度进行排序。

【技术实现步骤摘要】

本专利技术应用于发现学术社交网络中魔力研究社区,属于数据挖掘

技术介绍
近几年来,社交网络平台(例如:Facebook和Twitter)发展迅速。同时,社交网络分析也受到了学术界的广泛关注。学术网络作为社交网络中非常重要的组成部分,也成为了研究人员的研究重点,参见参考文献[1]J.Tang,J.Zhang,L.Yao,J.Li,L.Zhang,and Z.Su,“Arnetminer:extraction and mining of academic social networks,”in Proceedings of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining.ACM,2008,pp.990–998.参考文献[2]J.Tang,R.Jin,and J.Zhang,“A topic modeling approach and its integration into the random walk framework for academic search,”in Data Mining Eighth IEEE International Conference on.IEEE,2008,pp.1055–1060。参考文献[3](G.Wang,Y.Zhao,X.Shi,and P.S.Yu,“Magnet community identification on social networks,”in Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining.ACM,2012,pp.588–596.)提出了魔力社区的概念并把它应用于IT公司和金融企业吸引力的排序。该参考文献[3]旨在找到某种流行的社区,同时假设社区间是彼此独立的,一个人在某一时刻只能处于一个社区中。然而在很多现实场景中(如学术社交网络),如果把研究相同内容的研究人员看做一个社区,那么找到那些目前很新、未来会流行的社区而不是那些已经非常流行的社区更有价值。
技术实现思路
本专利技术的目的在于帮助研究人员,尤其是没有经验的研究人员,从宏观的角度对现有研究社区的发展有所认识,帮助研究人员更好地选择自己的研究课题。本专利技术提供一种学术社交网络中魔力研究社区的排序方法,所述排序方法中,给定一个时间窗口,在学术社交网络中发现魔力研究社区。所述的魔力研究社区不是指那些已经非常流行的社区,而是那些逐渐开始流行的有吸引力的研究社区。本专利技术适用于针对信息检索和社区推荐等应用。本专利技术提供的学术社交网络中魔力研究社区的排序方法,具体包括如下步骤:第一步,研究社区内部特征计算;选择新颖度作为研究社区内部特征FC,第j个研究社区Cj的新颖度Nj是指社区主题的单词从时间窗口s到s+1的频率变化,用Nj∈FC表示;研究社区Cj的新颖度Nj相当于主题下每
个单词新颖度的和;研究社区Cj的新颖度Nj通过以下方式计算: N j = Σ v = 1 | W | CW j v · l o g | C | δ C W v · δ W v ( s + 1 ) δ W v ( s ) + δ W v ( s + 1 ) - - - ( 1 ) ]]>其中,表示包含单词Wv的研究社区的数目,和分别表示单词Wv在时间窗口s和s+1中出现的次数;|W|是单词Wv的数量,v=1,2,…,|W|;|C|是研究社区网络中研究社区的数量;第二步,研究社区外部特征FE计算;给定研究人员Ri在时间窗口s和s+1的社区分布分别为和计算研究人员Ri总的转移量、计算研究人员Ri从研究社区Cj'到研究社区Cj的转移量以转移量为矩阵元素得到转移矩阵对每个研究人员Ri的转移矩阵相加,得到最终的转移矩阵T;第三步,排序;给定研究社区网络的带权有向图G=(C,E,FC,FE),对任意的Cj∈C,定义研究社区Cj吸引其他研究社区Cj'的研究人员注意力的能力ujj′: u jj ′ = α · T jj ′ T O j + ( 1 - α ) · N j - - - ( 2 ) ]]>其中,α是权重参数,是研究社区Cj到研究社区Cj'的转移矩阵Tjj'的转置,Oj是研究社区Cj的大小;对于任意的研究社区Cj∈C,它传播注意力到其他研究社区Cj'的能力定义为: v 本文档来自技高网
...

【技术保护点】
一种学术社交网络中魔力研究社区的排序方法,其特征在于,包括如下步骤:第一步,研究社区内部特征计算;选择新颖度作为研究社区内部特征FC,第j个研究社区Cj的新颖度Nj是指社区主题的单词从时间窗口s到s+1的频率变化,用Nj∈FC表示;研究社区Cj的新颖度Nj相当于主题下每个单词新颖度的和;研究社区Cj的新颖度Nj通过以下方式计算:Nj=Σv=1|W|CWjv·log|C|δCWv·δWv(s+1)δWv(s)+δWv(s+1)---(1)]]>其中,表示包含单词Wv的研究社区的数目,和分别表示单词Wv在时间窗口s和s+1中出现的次数;|W|是单词Wv的数量,v=1,2,…,|W|;|C|是研究社区网络中研究社区的数量;第二步,研究社区外部特征FE计算;给定研究人员Ri在时间窗口s和s+1的社区分布分别为和计算研究人员Ri总的转移量、计算研究人员Ri从研究社区Cj'到研究社区Cj的转移量以转移量为矩阵元素得到转移矩阵对每个研究人员Ri的转移矩阵相加,得到最终的转移矩阵T;第三步,排序;给定研究社区网络的带权有向图G=(C,E,FC,FE),对任意的Cj∈C,定义研究社区Cj吸引其他研究社区Cj'的研究人员注意力的能力ujj':ujj′=α·Tjj′TOj+(1-α)·Nj---(2)]]>其中,α是权重参数,是研究社区Cj到研究社区Cj'的转移矩阵Tjj'的转置,Oj是研究社区Cj的大小;对于任意的研究社区Cj∈C,它传播注意力到其他研究社区Cj'的能力定义为:vjj′=Tjj′Oj.---(3)]]>基于公式(2)和公式(3),为每个研究社区定义两个得分:正面得分PS和负面得分NS;正面得分从吸引注意力的角度衡量研究社区的吸引力,负面得分从传播注意力的角度衡量研究社区的吸引力,对于研究社区Cj的正面得分PSj和负面得分NSj的定义如下:{PSj=Σj′=1|C|1|Z|ujj′NSj′NSj=Σj′=1|C|1|Z′|vjj′PSj′---(4)]]>其中,和是标准化因子;基于这两个得分,研究社区Cj的吸引力等级Aj通过下面的公式来计算:Aj=PSj‑NSj  (5)。...

【技术特征摘要】
1.一种学术社交网络中魔力研究社区的排序方法,其特征在于,包括如下步骤:第一步,研究社区内部特征计算;选择新颖度作为研究社区内部特征FC,第j个研究社区Cj的新颖度Nj是指社区主题的单词从时间窗口s到s+1的频率变化,用Nj∈FC表示;研究社区Cj的新颖度Nj相当于主题下每个单词新颖度的和;研究社区Cj的新颖度Nj通过以下方式计算: N j = Σ v = 1 | W | CW j v · log | C | δ C W v · δ W v ( s + 1 ) δ W v ( s ) + δ W v ( s + 1 ) - - - ( 1 ) ]]>其中,表示包含单词Wv的研究社区的数目,和分别表示单词Wv在时间窗口s和s+1中出现的次数;|W|是单词Wv的数量,v=1,2,…,|W|;|C|是研究社区网络中研究社区的数量;第二步,研究社区外部特征FE计算;给定研究人员Ri在时间窗口s和s+1的社区分布分别为和计算研究人员Ri总的转移量、计算研究人员Ri从研究社区Cj'到研究社区Cj的转移量以转移量为矩阵元素得到转移矩阵对每个研究人员Ri的转移矩阵相加,得到最终的转移矩阵T;第三步,排序;给定研究社区网络的带权有向图G=(C,E,FC,FE),对任意的Cj∈C,定义研究社区Cj吸引其他研究社区Cj'的研究人员注意力的能力ujj': u jj ′ = α · T jj ′ T O j + ( 1 - α ) · N j - - - ( 2 ) ]]>其中,α是权重参数,是研究社区Cj到研究社区Cj'的转移矩阵Tjj'的转置,Oj是研究社区Cj的大小;对于任意的研究社区Cj∈C,它传播注意力到其他研究社区Cj'的能力定义为: v jj ′ = T jj ′ O j . - - - ( 3 ) ]]>基于公式(2)和公式(3),为每个研究社区定义两个得分:正面得分PS和负面得分NS;正面得分从吸引注意力的角度衡量研究社区的吸引力,负面得分从传播注意力的角度衡量研究社区的吸引力,对于研究社区Cj的正面得分PSj和负面得分NSj的定义如下: { PS j = Σ j ′ = 1 | C | 1 | Z | u ...

【专利技术属性】
技术研发人员:张忠宝苏森王亚坤徐嘉帅
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1