【技术实现步骤摘要】
一种复杂网络中社区个数估计方法
[0001]本专利技术涉及复杂网络社区发现
,更具体地说,特别涉及一种复杂网络中社区个数估计方法。
技术介绍
[0002]复杂网络一般指节点数目众多、连接关系复杂的网络。复杂网络是计算机科学、统计物理、系统科学等学科交叉研究的重要分支,同时也是分析和研究许多实际系统的交互事件不可缺少的工具。在复杂网络中,通常将系统中独立的个体数据称为节点,各节点相互之间的连接称为边,紧密连接的节点集称为社区。网络中的社区是现实世界社会关系的一种映射已成为复杂网络的一个重要特征,如何有效地发现社区已吸引了众多领域学者的研究。社区发现是一个揭示复杂网络中潜在社区结构的过程,具有很多现实意义,在现实生活中具有非常重要的应用价值,例如,在社交网络中挖掘具有共同兴趣或相似社会背景的社会群体进行准确的内容推广或广告宣传;在疾病传播网络中建立动态模型用于预测疫情发展趋势,以便于进行准确的疫情防控行动。
[0003]社区数量的估计对社区发现算法的应用有着重要的影响。目前,很多学者都提出了社区数量的估计算法,其中 ...
【技术保护点】
【技术特征摘要】
1.一种复杂网络中社区个数估计方法,其特征在于,该方法包括如下步骤:1.1、给服务器输入网络数据D用于社区个数估计;1.2、服务器对网络数据D采用第一算法进行网络嵌入,然后使用第二算法将网络嵌入聚成指定数量的类簇,其中,每一个类簇分别对应一个社区,重复对本步骤n次,以得到社区数为1到n为序列号的一系列社区划分h;1.3、计算任意两个相邻社区之间的平均互信息,并最终获得序列号1到n中的相邻社区划分中的所有平均互信息I的结果列表;1.4、计算每个社区划分中社区的每个节点的访问概率以及不同社区之间的跳转概率,从而得到对应社区划分的所有信息熵E的结果列表;1.5、根据如下公式计算社区个数K即可,公式如下:K=argmax{[I
K
(D;h)]
‑
E
K
[I(h)]}
ꢀꢀꢀꢀꢀ
公式(1)在公式(1)中,I
K
(D;h)为I的结果列表的序列号为K时的最大平均互信息,E
K
[I(h)]为E的结果列表的序列号为K时的最小信息熵。2.根据权利要求1所述的一种复杂网络中社区个数估计方法,其特征在于:在步骤1.2中,预先定义初始化计数为i,聚类结果集为p,并且,初始化计数值i=0,聚类次数为n,所述步骤1.2还包括:1.2.1、将初始化计数值i与聚类次数n进行比对,当i大于或者等于n时,执行步骤1.3;当i小于n时,执行如下步骤:1.2.2、服务器对网络数据D采用第一算法进行网络嵌入;1.2.3、通过第二算法将步骤1.2.2的网络嵌入聚成i+1类的类簇,从而得到数量为i+1的聚类结果集p,并以此循环,进而得到社区数为1到n为序列号的一系列社区划分h的聚类结果集p。3.根据权利要求2所述的一种复杂网络中社区个数估计方法,其特征在于:在步骤1.3中,令i=0,准备计算社区数为1到n为序列号的一系列社区划分h的相邻划分间的平均互信息I的结果列表I1、I2......I
n
,将i与n
‑
1进行比对:1.3.1、当i大于或者等于n
‑
1时,得到最终的平均互信息I的结果列表,执行步骤1.4;1.3.2、当i小于n
‑
1时,计算相邻两个社区划分之间的平均互信息,并以此循环,进而获得序列号1到n的社区划分h的最终平均互信息I的结果列表,再执行步骤1.4。4.根据权利要求3所述的一种复杂网络中社区个数估计方法,其特征在于:在步骤1.3中,从社区数为1到n为序列号的一系列社区划分h的聚类结果集p提取任意节点数据,通过如下公式计算平均互信息I:ω
ij
=P(X
i
,Y
j
)
ꢀꢀꢀꢀꢀꢀ
公式(3)其中,I(Xi;Yj)为社区Xi和社区Yj的互信息,P(Xi,Yj)为社区Xi和社区Yj的关联性,n
为网络中节点总数,为社区Xi和社区Yj共同节点的数量。5.根据权利要求3所述的一种复杂网络中社区个数估计方法,其特征在于:在步骤1.4中,其还包括如下步骤:1.4.1、通过预设的随机游走算法来计算每个划分社区h的每个节点的转移概率矩阵M;1.4.2、令i=0,准备利用各转移概率矩阵M内的每个划分社区的每个节点的访问概率以及不同划分社区之间的跳转概率进行计算,从而得到序列号1到n的划分社区h的信息熵E的结果列表E1、E2.........
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。