当前位置: 首页 > 专利查询>中南大学专利>正文

一种基于偏好学习机制的重叠社区发现方法及系统技术方案

技术编号:19057542 阅读:43 留言:0更新日期:2018-09-29 12:18
本发明专利技术涉及复杂网络重叠社区发现领域,公开了一种基于偏好学习机制的重叠社区发现方法及系统,以考虑偏好关系,达到快速、高效、准确、稳定的检测出复杂网络中的重叠社区的目的;本发明专利技术的方法包括为每一个节点分配唯一的标签,设定节点对该标签的从属度,然后定义节点的重要性;计算节点之间的偏好程度;根据偏好程度选择学习对象对节点进行归一化处理,得到经过一次迭代后的各节点关系图;基于上一次迭代后的各节点关系图进一步迭代,以此类推,直至迭代至设定次数以得到最终的各节点关系图,将拥有相同标签的节点划分为同一个社区,将拥有至少两个标签的节点视为重叠节点,将重叠节点所在的社区视为重叠社区。

【技术实现步骤摘要】
一种基于偏好学习机制的重叠社区发现方法及系统
本专利技术涉及复杂网络重叠社区发现领域,尤其涉及一种基于偏好学习机制的重叠社区发现方法及系统。
技术介绍
近年来,复杂网络的研究受到了学术界及商业界的普遍关怀,尤其是随着web2.0技术的迅猛发展及移动终端的普及,信息共享网络、博客网络、通讯系统、邮件网络、短信网络与在线聊天室等在线社区网络的飞速发展吸引了人们高度的注意,成为人们生活中必不可少的社交工具,帮助人们在虚拟世界中维护着自己的化会关系。因此,对以社交网络系统为代表的复杂系统进行评估成为一项越来越重要的事情。其中,复杂网络研究中的一个热门话题就是社区发现。社区概念可从两个方面来理解:一是社区的成员有共同的兴趣爱好;二是社区的成员之间的联系相比于社区外的联系要紧密。因此,发现社区的过程,主要是通过一定的算法计算这些成员间的紧密程度,来实现社区网络的划分。在大型复杂网络中自动搜寻或发现社区,具有非常重要的实用价值。比如发现潜在的犯罪团伙、更加精准的进行市场营销、预测防备病毒的传播等。移动通讯公司可以针对不同的社区提供不同的个性化服务,根据具体需求为用户推荐业务,在知晓社区恃性及网络结构的前提下,这样的推荐具有更高的成功率。此外,在生物学网络中,通过社区可以发现物质元素的组成具有一定的规律化,能助于人们理解其中的网络结构,更清晰地探索其内部的运行机理。在计算机科学中,社区网络的分析和研究有助于在并行计算中合理地分配任务,减少通信成本,提高计算的效率。社区网络包括非重叠社区与重叠社区,现实生活中的社区网络节点大多属于多个社区,比如节点1既属于社区A,又属于社区B,则认为社区A与社区B为重叠社区;由于社交网络中每个人的兴趣并不是单一的,因此重叠社区普遍存在,且通过重叠社区进行分析与研究能得到更符合现实需要的结果;目前,采用发现重叠社区的发现方法多为仅仅关注连接本身而忽略了连接中所隐藏的偏好信息,且当前大多数算法进行标签传播过程时节点更新顺序是随机的,这就容易导致每一次执行算法产生的结果都有可能不一样,从而导致算法的不稳定性和分析结果不准确等局面。因此,如何考虑偏好关系,快速、高效、准确、稳定的检测出复杂网络中的重叠社区结构成为急需解决的问题。
技术实现思路
本专利技术目的在于提供一种基于偏好学习机制的重叠社区发现方法及系统,以考虑偏好关系,达到快速、高效、准确、稳定的检测出复杂网络中的重叠社区的目的。为实现上述目的,本专利技术提供了一种基于偏好学习机制的重叠社区发现方法,包括以下步骤:S1:为每一个节点分配唯一的标签,设定节点对该标签的从属度,然后根据节点的度数和局部聚类系数定义节点的重要性,其中,将节点的局部聚类系数记为C(x),采用计算公式为:式中,N(x)表示节点x的度数,n表示节点x与其邻居节点所形成集合中节点之间所能形成的边的个数;将节点的重要性记为Importance(x),采用计算公式为:Importance(x)=|N(x)"2*C(x);S2:根据所述节点的重要性以从高到低的顺序对节点进行排序,定义各节点之间的标签相似度、jaccard系数以及连接强度,并计算节点之间的偏好程度,其中,偏好程度的计算公式为:Preference(x,y)=|N(y)|*Jaccard(x,y)*eC(y)+CS(x,y)+LS(x,y);式中,Preference(x,y表)示节点x对节点y的偏好程度,N(y)表示节点y的度数,Jaccard(x,y)表示节点x与节点y的jaccard系数,C(y)表示节点y的局部聚类系数,CS(x,y)表示节点x与节点y的连接强度,LS(x,y)表示节点x与节点y的标签相似度;S3:选择最重要的节点,根据所述最重要的节点的偏好程度为所述最重要的节点选择学习对象,并根据学习结果对所述最重要的节点进行归一化处理;然后选择第二重要的节点,根据所述第二重要的节点的偏好程度为所述第二重要的节点选择学习对象,并根据学习结果对所述第二重要的节点进行归一化处理;以此类推,直至完成对排序最末的节点的归一化处理,以实现一次迭代过程,得到经过一次迭代后的各节点关系图;其中,所述各节点关系图包括各节点拥有的标签和各节点对该标签的从属度;S4:基于上一次迭代后的各节点关系图,并对各节点引入新的学习对象重复上述步骤S3,以此类推,直至迭代至设定次数以得到最终的各节点关系图,将拥有相同标签的节点划分为同一个社区,将拥有至少两个标签的节点视为重叠节点,将所述重叠节点所在的社区视为重叠社区。优选地,所述根据所述节点的节点度数和节点局部聚类系数定义所述节点的重要性具体包括以下步骤:(1)为待检测社区的每一个节点分配一个唯一的标签;(2)计算节点的局部聚类系数C(x),采用计算公式为:式中,|N(x)|表示节点x的邻居个数,n表示节点x与其邻居节点所形成集合中节点之间所能形成的边的个数。(3)根据所述局部聚类系数和节点度数计算节点的重要性Importance(x),采用计算公式为:Importance(x)=|N(x)|2*C(x)。优选地,所述步骤S2具体包括以下步骤:(1)定义节点x与其邻居节点y的jaccard系数为:式中,Γ(x)表示包含节点x与其邻居节点的集合,Γ(y)表示包含节点y与其邻居节点的集合,其中,Γ(x)的计算公式为:Γ(x)={y∈V|(x,y)∈E}∪{x};式中,V表示各节点集合,E表示各节点的连边集合;(2)定义节点x与其邻居节点y的连接强度:节点x和其两个邻居节点能形成一个三角形,式中,Tx表示包含节点x的三角形个数,|N(x)∩N(y)|表示同时包含节点x和节点y的三角形个数;(3)定义节点x与其邻居节点y的标签相似度:式中,Cx表示节点x所属的标签,LS(x,y)的取值范围为[0,1];(4)根据上述步骤(1)、步骤(2)以及步骤(3)计算得到偏好学习公式为:Preference(x,y)=|N(y)|*Jaccard(x,y)*eC(y)+CS(x,y)+LS(x,y)。优选地,在进行所述步骤(1)之前,节点x根据以下公式计算得到需学习的对象节点y:式中,N(x)表示节点x邻居节点的集合,yi表示节点x的邻居节点。优选地,所述步骤S3中所述归一化处理具体包括传播节点标签、更新节点对相应标签的从属度以及淘汰从属度小于设定值的节点。优选地,所述设定值为1/|N(x)|,其中,|N(x)|表示节点x的度数。为实现上述目的,本专利技术提供一种基于偏好学习机制的重叠社区发现系统,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法的步骤。本专利技术具有以下有益效果:1)根据节点的度数和局部聚类系数定义节点的重要性,并基于节点的重要性对节点进行排序,保证了节点更新时的固定顺序,克服了原有算法的随机性,提高了本方法在使用过程中的稳定性与鲁棒性;2)基于偏好学习机制的重叠社区发现方法模拟了现实生活中人们信息交流场景,保证了算法结果的高准确性、高稳定性以及高效率性;3)本专利技术基于LPA算法提出基于偏好学习机制的重叠社区发现方法,具有快速且高效的收敛能力,且实现了分析过程的无参化,适用性强。下面将参照附图,对本专利技术作进一步详细的说明。附图说明构本文档来自技高网
...

【技术保护点】
1.一种基于偏好学习机制的重叠社区发现方法,其特征在于,包括以下步骤:S1:为每一个节点分配唯一的标签,设定节点对该标签的从属度,然后根据节点的度数和局部聚类系数定义节点的重要性,其中,将节点的局部聚类系数记为C(x),采用计算公式为:

【技术特征摘要】
1.一种基于偏好学习机制的重叠社区发现方法,其特征在于,包括以下步骤:S1:为每一个节点分配唯一的标签,设定节点对该标签的从属度,然后根据节点的度数和局部聚类系数定义节点的重要性,其中,将节点的局部聚类系数记为C(x),采用计算公式为:式中,N(x)表示节点x的度数,n表示节点x与其邻居节点所形成集合中节点之间所能形成的边的个数;将节点的重要性记为Importance(x),采用计算公式为:Importance(x)=|N(x)|2*C(x);S2:根据所述节点的重要性以从高到低的顺序对节点进行排序,定义各节点之间的标签相似度、jaccard系数以及连接强度,并计算节点之间的偏好程度,其中,偏好程度的计算公式为:Preference(x,y)=|N(y)|*Jaccard(x,y)*eC(y)+CS(x,y)+LS(x,y);式中,Preference(x,y)表示节点x对节点y的偏好程度,N(y)表示节点y的度数,Jaccard(x,y)表示节点x与节点y的jaccard系数,C(y)表示节点y的局部聚类系数,CS(x,y)表示节点x与节点y的连接强度,LS(x,y)表示节点x与节点y的标签相似度;S3:选择最重要的节点,根据所述最重要的节点的偏好程度为所述最重要的节点选择学习对象,并根据学习结果对所述最重要的节点进行归一化处理;然后选择第二重要的节点,根据所述第二重要的节点的偏好程度为所述第二重要的节点选择学习对象,并根据学习结果对所述第二重要的节点进行归一化处理;以此类推,直至完成对排序最末的节点的归一化处理,以实现一次迭代过程,得到经过一次迭代后的各节点关系图;其中,所述各节点关系图包括各节点拥有的标签和各节点对该标签的从属度;S4:基于上一次迭代后的各节点关系图,并对各节点引入新的学习对象重复上述步骤S3,以此类推,直至迭代至设定次数以得到最终的各节点关系图,将拥有相同标签的节点划分为同一个社区,将拥有至少...

【专利技术属性】
技术研发人员:盛津芳王凯王斌李钊
申请(专利权)人:中南大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1