基于平均互信息的社区划分质量评价方法及系统技术方案

技术编号:18810577 阅读:23 留言:0更新日期:2018-09-01 09:34
本发明专利技术公开了一种基于平均互信息的社区划分质量评价方法及系统,在经典GN社区划分系统的基础上,加入了基于平均互信息的社区划分质量评价方法,首先通过计算每次社区划分的平均互信息值从而选出平均互信息最大值所对应的最优社区划分,然后分别计算最优社区划分前后社区结构的信息熵从而确定优化的社区结构,紧接着对优化后的社区结构中的所有节点进行遍历,找到与多个社区的链接数相同的节点,最后分别计算将该节点放到不同社区时网络中总的信息熵,输出总信息熵最小值所对应的社区结构即为最优的社区结构,有效地提高了社区划分结果的准确性。

Quality evaluation method and system of community partition based on average mutual information

The invention discloses a community partitioning quality evaluation method and system based on average mutual information. On the basis of the classical GN community partitioning system, a community partitioning quality evaluation method based on average mutual information is added. Firstly, the maximum value of average mutual information is selected by calculating the average mutual information value of each community partition. Then the information entropy of the community structure before and after the optimal community division is calculated to determine the optimal community structure. Then all the nodes in the optimized community structure are traversed to find the nodes with the same number of links as many communities. Finally, the nodes are placed in different communities. The community structure corresponding to the minimum output of total information entropy is the optimal community structure, which effectively improves the accuracy of community partition results.

【技术实现步骤摘要】
基于平均互信息的社区划分质量评价方法及系统
本专利技术涉及社区划分质量评价领域,具体涉及一种基于平均互信息的社区划分质量评价方法及系统。
技术介绍
随着互联网、物联网技术的快速发展,事物之间的联系更加紧密,错综复杂的联系形成了多样、多变、规模庞大的网络,这样的网络被称为复杂网络。所谓社区是指具有关联的个体所组成的集合,复杂网络由若干社区组成。社区划分涉及计算机、物理、生物、社会学以及复杂性系统科学等多学科,近年来成为多个学科的研究热点之一。在社区划分中,社区划分系统通常会构造并评判多种社区结构,并从一种社区结构演变到另一种社区结构。优化社区划分系统的关键是找到一种社区划分质量评价方法,通过该评价方法优化社区划分系统,从而提高社区划分系统的准确性。但是,目前对社区划分质量评价方法的思路主要还是集中在模块度评价方法,而模块度评价方法存在Resolutionlimit的问题。虽然也有社区划分质量评价方法是基于信息论的相关知识,但是在使用基于信息论方面的评价方法时,需要知道一些先验条件。
技术实现思路
本专利技术的目的是针对现有技术的不足,提供了一种基于平均互信息的社区划分质量评价方法,所述方法针对已有的经典社区划分系统,从社区划分质量评价的角度出发,以平均互信息为基础,可以在无先验条件的情况下,利用该评价方法从多个社区划分候选解中找出最优的社区划分,有效地提高了社区划分结果的准确性。同时本专利技术还公开了一种基于平均互信息的社区划分质量评价系统。本专利技术具体的技术方案为:一种基于平均互信息的社区划分质量评价方法,所述方法包括以下步骤:S1、服务器接收社区划分请求;S2、采用边介数算法对社区划分请求进行边介数计算,得到边介数计算结果;S3、根据边介数计算结果,对边介数最大的边进行删除,得到删除边前后的社区划分结果,服务器查看删除边后的社区是否已经发生分裂,若是则进行步骤S4,若否,则返回步骤S2重新对删除边后的社区根据社区划分请求进行边介数计算;S4、对步骤S3得到的所有删除边前后的社区划分结果计算平均互信息值,得到互信息结果,服务器查看本次删除边后的互信息结果是否为最大的互信息结果,若是则修改最大互信息结果并且记录最大互信息结果所对应的社区划分前后的社区结构,然后再进行步骤S5,若否,则直接进行步骤S5;S5、判断当前社区是否还存在边,若是,则返回步骤S2重新对删除边后的社区根据社区划分请求进行边介数计算,若否则进行步骤S6;S6、判断步骤S4中最大互信息结果对应社区划分前的社区结构的信息熵是否大于最大互信息结果对应社区划分后的社区结构的信息熵,若否,则记录最大互信息结果对应社区划分前的社区结构为社区划分结果,若是,则记录最大互信息结果对应社区划分后的社区结构为社区划分结果;S7、根据步骤S6中的社区划分结果,利用与多个社区链接数相同的节点进一步优化社区划分结果,得到最终的社区划分结果;S8、将最终的社区划分结果发送给客户端。进一步地,步骤S2中所述采用边介数算法对社区划分请求进行边介数计算的具体操作为:对社区划分请求进行最短路径的计算从而得到边介数的计算结果。进一步地,步骤S3的具体过程为:首先对边介数按从大到小排序,删除边介数最大的边,然后将删除前后的结果存入社区划分结果中。进一步地,步骤S4中所述删除边前后的社区划分结果的平均互信息值的计算公式为:QI=E[I(Xi;Yj)]=ΣiΣjP(Xi,Yj)I(Xi;Yj),其中Xi表示社区划分前的第i个社区,Yj表示社区划分后的第j个社区,QI为平均互信息值。进一步地,步骤S6中所述信息熵值的计算公式为:H(X)=-Σx(P(x=1)log2P(x=1)+P(x=0)log2P(x=0)),其中P(x=1)表示节点被划分到社区x的概率,P(x=0)表示节点未被划分到社区x的概率,H(X)为信息熵值。进一步地,步骤S7的具体过程为:首先找到与多个社区相连的节点,然后分别将该节点放入多个相连的社区,分别计算将该节点放到不同社区时网络中总的信息熵,输出总信息熵最小值所对应的社区结构即为最终的社区划分结果。同时,本专利技术公开了一种应用于上述基于平均互信息的社区划分质量评价方法的系统,所述系统包括客户端和服务器,其中服务器包括以下模块:请求接收模块:用于接收客户端发送的社区划分请求;计算边介数模块:用于计算边介数,得到边介数计算结果;删除边介数模块:用于根据边介数计算结果,对边介数最大的边进行删除,得到删除边介数前后的社区划分结果;计算平均互信息值模块:用于计算平均互信息值,得到互信息结果;计算信息熵值模块:用于计算划分前后的信息熵值,得到信息熵值最小的社区划分结果;优化模块:用于根据社区划分结果,利用与多个社区链接数相同的节点进一步优化社区划分结果,得到最终的社区划分结果;输出模块:用于将最终的社区划分结果发送至客户端。本专利技术与现有技术相比,具有如下优点和有益效果:1、本专利技术通过在社区划分系统中引入基于平均互信息的社区划分质量评价方法,该评价方法在每次社区划分过程中计算社区划分的平均互信息值,找出平均互信息最大值所对应的社区划分,进一步对平均互信息最大值所对应社区划分前后的社区结构进行信息熵的比较,得到信息熵最小的社区划分结构,最后利用与多个社区链接数相同的节点进一步优化社区划分结果,得到最终的社区划分结果,从而达到了提高社区划分结果准确性的目的。2、本专利技术采用基于平均互信息的社区划分质量评价方法,该评价方法相对于其它基于信息论的评价方法来说,可以在不需要先验条件的前提下使用。附图说明图1为本专利技术实施例基于平均互信息的社区划分质量评价方法的流程图。图2(a)为本专利技术实施例中社区没有发生分裂的示意图,图2(b)为本专利技术实施例中社区分裂成其他两个社区的示意图。图3为本专利技术实施例中与多个社区的链接数相同的节点的示例图。具体实施方式下面结合实施例及附图对本专利技术作进一步详细的描述,但本专利技术的实施方式不限于此。实施例:本专利技术实施例在经典GN社区划分系统的基础上,加入了基于平均互信息的社区划分质量评价方法。基于平均互信息的社区划分质量评价方法是本专利技术的核心内容。加入基于平均互信息的社区划分质量评价方法后的社区划分系统首先通过计算每次社区划分的平均互信息值从而选出平均互信息最大值所对应的最优社区划分,然后分别计算最优社区划分前后社区结构的信息熵从而确定优化的社区结构,紧接着对优化后的社区结构中的所有节点进行遍历,找到与多个社区的链接数相同的节点,最后分别计算将该节点放到不同社区时网络中总的信息熵,输出总信息熵最小值所对应的社区结构即为最优的社区结构。本专利技术实施例另外提供了一种基于平均互信息的社区划分质量评价系统,所述系统包括客户端和服务器,其中服务器包括以下模块:请求接收模块:用于接收客户端发送的社区划分请求;计算边介数模块:用于计算边介数,得到边介数计算结果;删除边介数模块:用于根据边介数计算结果,对边介数最大的边进行删除,得到删除边介数前后的社区划分结果;计算平均互信息值模块:用于计算平均互信息值,得到互信息结果;计算信息熵值模块:用于计算划分前后的信息熵值,得到信息熵值最小的社区划分结果;优化模块:用于根据社区划分结果,利用与多个社区链接数相同的节点进一步优化社区划分结果,得到最本文档来自技高网...

【技术保护点】
1.一种基于平均互信息的社区划分质量评价方法,其特征在于,所述方法包括以下步骤:S1、服务器接收社区划分请求;S2、采用边介数算法对社区划分请求进行边介数计算,得到边介数计算结果;S3、根据边介数计算结果,对边介数最大的边进行删除,得到删除边前后的社区划分结果,服务器查看删除边后的社区是否已经发生分裂,若是则进行步骤S4,若否,则返回步骤S2重新对删除边后的社区根据社区划分请求进行边介数计算;S4、对步骤S3得到的所有删除边前后的社区划分结果计算平均互信息值,得到互信息结果,服务器查看本次删除边后的互信息结果是否为最大的互信息结果,若是则修改最大互信息结果并且记录最大互信息结果所对应的社区划分前后的社区结构,然后再进行步骤S5,若否,则直接进行步骤S5;S5、判断当前社区是否还存在边,若是,则返回步骤S2重新对删除边后的社区根据社区划分请求进行边介数计算,若否则进行步骤S6;S6、判断步骤S4中最大互信息结果对应社区划分前的社区结构的信息熵是否大于最大互信息结果对应社区划分后的社区结构的信息熵,若否,则记录最大互信息结果对应社区划分前的社区结构为社区划分结果,若是,则记录最大互信息结果对应社区划分后的社区结构为社区划分结果;S7、根据步骤S6中的社区划分结果,利用与多个社区链接数相同的节点进一步优化社区划分结果,得到最终的社区划分结果;S8、将最终的社区划分结果发送给客户端。...

【技术特征摘要】
1.一种基于平均互信息的社区划分质量评价方法,其特征在于,所述方法包括以下步骤:S1、服务器接收社区划分请求;S2、采用边介数算法对社区划分请求进行边介数计算,得到边介数计算结果;S3、根据边介数计算结果,对边介数最大的边进行删除,得到删除边前后的社区划分结果,服务器查看删除边后的社区是否已经发生分裂,若是则进行步骤S4,若否,则返回步骤S2重新对删除边后的社区根据社区划分请求进行边介数计算;S4、对步骤S3得到的所有删除边前后的社区划分结果计算平均互信息值,得到互信息结果,服务器查看本次删除边后的互信息结果是否为最大的互信息结果,若是则修改最大互信息结果并且记录最大互信息结果所对应的社区划分前后的社区结构,然后再进行步骤S5,若否,则直接进行步骤S5;S5、判断当前社区是否还存在边,若是,则返回步骤S2重新对删除边后的社区根据社区划分请求进行边介数计算,若否则进行步骤S6;S6、判断步骤S4中最大互信息结果对应社区划分前的社区结构的信息熵是否大于最大互信息结果对应社区划分后的社区结构的信息熵,若否,则记录最大互信息结果对应社区划分前的社区结构为社区划分结果,若是,则记录最大互信息结果对应社区划分后的社区结构为社区划分结果;S7、根据步骤S6中的社区划分结果,利用与多个社区链接数相同的节点进一步优化社区划分结果,得到最终的社区划分结果;S8、将最终的社区划分结果发送给客户端。2.根据权利要求1所述的一种基于平均互信息的社区划分质量评价方法,其特征在于,步骤S2中所述采用边介数算法对社区划分请求进行边介数计算的具体操作为:对社区划分请求进行最短路径的计算从而得到边介数的计算结果。3.根据权利要求1所述的一种基于平均互信息的社区划分质量评价方法,其特征在于,步骤S3的具体过程为:首先对边介数按从大到小排序,删除边介数最大的边,然后将删除前...

【专利技术属性】
技术研发人员:李东程鸣权
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1