利用局部距离和节点秩优化函数的社交网络社区发现方法技术

技术编号:25837654 阅读:38 留言:0更新日期:2020-10-02 14:18
本发明专利技术提出了一种利用局部距离和节点秩优化函数的社交网络社区发现方法,包括以下步骤:S1,获取网络社交节点数据集,对获取的网络社交节点数据集进行拉普拉斯归一化处理;得到拉普拉斯节点矩阵;S2,根据网络社交的内部距离和外部距离,计算得到网络社交节点值:若网络社交节点值大于或者等于预设网络社交节点值,则发现网络社交社区;若网络社交节点值小于预设网络社交节点值,则重新发现网络社交社区;S3,对步骤S2中发现的网络社交社区进行优化。本发明专利技术首先考虑了节点自传递问题。其次,提出的方法综合考量了边权值问题,能够有效表示出整个社交网络的特征结构。第三,在处理多比例最优化问题上,本发明专利技术的优化函数能有效找到最优的社区结构。最后本发明专利技术与其他方法相比,具有更好的性能。

【技术实现步骤摘要】
利用局部距离和节点秩优化函数的社交网络社区发现方法
本专利技术涉及一种社交网络
,特别是涉及一种利用局部距离和节点秩优化函数的社交网络社区发现方法。
技术介绍
在过去的二十年中,互联网发展全球化进程的提速,数据网络在人类社会中的地位变得愈来愈重要,研究人员对复杂网络的研究也越来越感兴趣。在大自然中,复杂网络形式多样,由相互影响相对独立的社区组成。例如,社交网络、生物网络、经济网络、信息网络等等。社区结构是复杂网络的重要拓扑属性,所以社区发现在复杂网络分析和数据挖掘等研究中具有重要意义。这种属性使社区发现更好地分析复杂网络并提取有用的信息并应用于各个领域,例如文本分析,个性推荐系统,用户标识,流行病传播,行为预测。尽管已经有很多关于社交网络社区发现的文章,在网络中,每个集群中包含的节点之间必须以某种方式彼此关联,而不是与集群外部的节点相关,从而形成一个社区。因此大多数研究人员都认为,社区的特征是社区节点之间紧密连接以及与社区外部的节点稀疏连接。自从Girvan和Newman创性的工作以来,已经提出了许多用于复杂网络中社区检测的算法,其中最为典型算法,例如模块度优化算法,标签传播算法,贪心算法,随机游走算法,谱划分算法,模糊算法。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种利用局部距离和节点秩优化函数的社交网络社区发现方法。为了实现本专利技术的上述目的,本专利技术提供了一种利用局部距离和节点秩优化函数的社交网络社区发现方法,包括以下步骤:<br>S1,获取网络社交节点数据集,对获取的网络社交节点数据集进行拉普拉斯归一化处理;得到拉普拉斯节点矩阵;S2,根据网络社交的内部距离和外部距离,计算得到网络社交节点值:若网络社交节点值大于或者等于预设网络社交节点值,则发现网络社交社区;若网络社交节点值小于预设网络社交节点值,则重新发现网络社交社区;S3,对步骤S2中发现的网络社交社区进行优化。在本专利技术的一种优选实施方式中,在步骤S1中,对获取的网络社交节点进行拉普拉斯归一化处理计算方法为:其中,D表示节点度矩阵;表示未归一化的拉普拉斯矩阵;A表示邻接矩阵。在本专利技术的一种优选实施方式中,在步骤S1中,拉普拉斯节点矩阵中元素值的计算方法为:其中,deg(vi)表示节点i的度;deg(vj)表示节点j的度;vi表示节点i;vj表示节点j;表示拉普拉斯节点矩阵中第i行第j列的元素值。在本专利技术的一种优选实施方式中,在步骤S2中,网络社交的内部距离的计算方法为:其中,Lsym表示拉普拉斯节点矩阵;表示节点集合Vk的邻接矩阵;G表示社交网络;Vk表示节点集合;k=1,2,3,...,K;dinternal(G,Vk)表示网络社交的内部距离。在本专利技术的一种优选实施方式中,在步骤S2中,网络社交的外部距离的计算方法为:其中,Lsym表示拉普拉斯节点矩阵;表示V-Vk的邻接矩阵;表示节点集合Vk的邻接矩阵;V表示节点分区集合;V={V1,V2,V3,...,VK};G表示社交网络;Vk表示节点集合;k=1,2,3,...,K;dexternal(G,Vk)表示网络社交的外部距离。在本专利技术的一种优选实施方式中,在步骤S2中,网络社交节点值的计算方法为:其中,Vk表示节点集合;k=1,2,3,...,K;V表示节点分区集合;V={V1,V2,V3,...,VK};dinternal(G,Vk)表示网络社交的外部距离;dexternal(G,Vk)表示网络社交的内部距离;SLDL(G,V)表示网络社交节点值。在本专利技术的一种优选实施方式中,在步骤S2中,节点集合Vk的邻接矩阵AVk的计算方法为:其中,Vk表示节点集合;k=1,2,3,...,K;V表示节点分区集合;V={V1,V2,V3,...,VK};vx表示节点x;x=1,2,3,...,N;vy表示节点y;y=1,2,3,...,N。在本专利技术的一种优选实施方式中,在步骤S2中,节点集合V-Vk的邻接矩阵的计算方法为:其中,Vk表示节点集合;k=1,2,3,...,K;V表示节点分区集合;V={V1,V2,V3,...,VK};vx表示节点x;x=1,2,3,...,N;vy表示节点y;y=1,2,3,...,N。在本专利技术的一种优选实施方式中,在步骤S3中,对发现的网络社交社区进行优化的方法为:其中,Vk表示节点集合,k=1,2,3,...,K;V表示节点分区集合;V={V1,V1,V1,...,VK};vi表示节点i;:表示在……情况下,有……;V[vi]表示节点i属于节点集合V[vi];vj表示节点j;Aij表示邻接矩阵A中的第i行第j列元素值;若成立,则保留节点集合V[vi];若不成立,则舍去节点集合V[vi]。综上所述,由于采用了上述技术方案,首先,本专利技术考虑了节点自传递问题。其次,提出的方法综合考量了边权值问题,能够有效表示出整个社交网络的特征结构。第三,在处理多比例最优化问题上,本专利技术的优化函数能有效找到最优的社区结构。最后本专利技术与其他方法相比,具有更好的性能。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术流程示意图。图2是本专利技术局部距离社区分区示意图。图3是本专利技术不同算法在人工网络上的比较示意图。图4是本专利技术社区发现过程概览示意图。图5是本专利技术在不同网络上的可视化示意图。图6是本专利技术在真实数据网络的社区成员关系示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。迄今为止,已经提出了一些经典和有效的局部社区发现算法和MF算法,Liu等人提出一种基于节点对相似度的局部社区发现框架,通过嵌入更好的节点相似度度量可以获得新的局部社区发现算法。Clauset等人提出了用于测量局部社区结构的算法R,计算方法如下:式中,B是一个局部社区,R表示测量局部社区结构的算法,Bin表示端点全部在局部社区B中的边数,而Bout是在局部社区B中具有一个端点的边数。该算法需要预先定义社区的大小。它会连续向本文档来自技高网...

【技术保护点】
1.一种利用局部距离和节点秩优化函数的社交网络社区发现方法,其特征在于,包括以下步骤:/nS1,获取网络社交节点数据集,对获取的网络社交节点数据集进行拉普拉斯归一化处理;得到拉普拉斯节点矩阵;/nS2,根据网络社交的内部距离和外部距离,计算得到网络社交节点值:/n若网络社交节点值大于或者等于预设网络社交节点值,则发现网络社交社区;/n若网络社交节点值小于预设网络社交节点值,则重新发现网络社交社区;/nS3,对步骤S2中发现的网络社交社区进行优化。/n

【技术特征摘要】
1.一种利用局部距离和节点秩优化函数的社交网络社区发现方法,其特征在于,包括以下步骤:
S1,获取网络社交节点数据集,对获取的网络社交节点数据集进行拉普拉斯归一化处理;得到拉普拉斯节点矩阵;
S2,根据网络社交的内部距离和外部距离,计算得到网络社交节点值:
若网络社交节点值大于或者等于预设网络社交节点值,则发现网络社交社区;
若网络社交节点值小于预设网络社交节点值,则重新发现网络社交社区;
S3,对步骤S2中发现的网络社交社区进行优化。


2.根据权利要求1所述的利用局部距离和节点秩优化函数的社交网络社区发现方法,其特征在于,在步骤S1中,对获取的网络社交节点进行拉普拉斯归一化处理计算方法为:



其中,D表示节点度矩阵;

表示未归一化的拉普拉斯矩阵;
A表示邻接矩阵。


3.根据权利要求1所述的利用局部距离和节点秩优化函数的社交网络社区发现方法,其特征在于,在步骤S1中,拉普拉斯节点矩阵中元素值的计算方法为:



其中,deg(vi)表示节点i的度;
deg(vj)表示节点j的度;
vi表示节点i;
vj表示节点j;

表示拉普拉斯节点矩阵中第i行第j列的元素值。


4.根据权利要求1所述的利用局部距离和节点秩优化函数的社交网络社区发现方法,其特征在于,在步骤S2中,网络社交的内部距离的计算方法为:



其中,Lsym表示拉普拉斯节点矩阵;

表示节点集合Vk的邻接矩阵;
G表示社交网络;
Vk表示节点集合;k=1,2,3,...,K;
dinternal(G,Vk)表示网络社交的内部距离。


5.根据权利要求1所述的利用局部距离和节点秩优化函数的社交网络社区发现方法,其特征在于,在步骤S2中,网络社交的外部距离的计算方法为:



其中,Lsym表示拉普拉斯节点矩阵;

表示V-Vk的邻接矩阵;

表示节点集合Vk的邻接矩阵;
V表示节点分区集合;V={V1,V2,V3,...,VK};
G表示社交网络;
Vk表示节点集合;k=1,2...

【专利技术属性】
技术研发人员:刘小洋丁楠李祥
申请(专利权)人:重庆理工大学
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1