The invention discloses a method and device for discovering label propagation algorithm based on community, the method includes: for the said social network node from the graph will update the label, the number of each label in the statistics all the neighbor nodes and the node of the only label in judgment at all; the neighbor node node to update the label in the label, whether the number is only one tag up: if the judgment number has more than two kinds of labels up through the local similarity calculation formula is calculated respectively in the node is to update the label with a similarity between each neighbor node label number of the most, and update node will update the label with the highest similarity of neighbor nodes of the label. By adding the similarity between the nodes that will update labels and their neighbors, this parameter selects the labels of the nearest neighbor nodes, updates the labels of the nodes, and divides the communities more accurately and stably, which will update the labels of the nodes.
【技术实现步骤摘要】
一种基于标签传播算法的社区发现方法和装置
本专利技术涉及信息技术,尤指一种基于标签传播算法的社区发现方法和装置。
技术介绍
在现实世界中,许多系统以网络的形式连接在一起,而社区发现作为研究复杂网络的方法,对于研究网络的规律以及预测网络的走向都具有重要意义。对于社区发现的研究,目前分为两个方向:一种是将图形理论应用到复杂网络的研究中,将图中的点抽象为网络中的个体,将边抽象为不同个体之间的联系;另一种是通过数据挖掘等聚类算法对网络进行划分。其中,基于网络拓扑的标签传递算法(LabelPropagationAlgorithm,简称为LPA)在社区发现应用广泛,具有简单实现等特点,但原始的LPA也存在这一些缺陷:由于标签传播过程中,是随机选择标签来更新原有标签的,因此导致基于标签而产生的算法的结果不稳定。
技术实现思路
为了解决上述技术问题,本专利技术提供了一种基于标签传播算法的社区发现方法和装置,其能够更加准确而稳定地划分将要更新标签的节点所在的社区。为了达到本专利技术目的,本专利技术实施例提供了一种基于标签传播算法的社区发现方法,该方法包括:按照标签传播顺序更新节点的标签 ...
【技术保护点】
一种基于标签传播算法的社区发现方法,其特征在于,所述方法包括按照标签传播顺序更新节点的标签的步骤,所述按照标签传播顺序更新节点的标签的步骤包括下列步骤:对于在表示社交网络的社交网络图中的将要更新标签的节点,统计在所述将要更新标签的节点的所有邻居节点的唯一的标签中的每种标签的数量;判断在所述将要更新标签的节点的所有邻居节点的标签中,是否仅有一种标签的数量最多:若判断仅有一种标签的数量最多,则采用数量最多的标签来更新所述将要更新标签的节点的标签;若判断有两种以上的标签的数量最多,则通过局部相似性计算公式分别计算在所述将要更新标签的节点与具有数量最多的标签的各个邻居节点之间的相似 ...
【技术特征摘要】
1.一种基于标签传播算法的社区发现方法,其特征在于,所述方法包括按照标签传播顺序更新节点的标签的步骤,所述按照标签传播顺序更新节点的标签的步骤包括下列步骤:对于在表示社交网络的社交网络图中的将要更新标签的节点,统计在所述将要更新标签的节点的所有邻居节点的唯一的标签中的每种标签的数量;判断在所述将要更新标签的节点的所有邻居节点的标签中,是否仅有一种标签的数量最多:若判断仅有一种标签的数量最多,则采用数量最多的标签来更新所述将要更新标签的节点的标签;若判断有两种以上的标签的数量最多,则通过局部相似性计算公式分别计算在所述将要更新标签的节点与具有数量最多的标签的各个邻居节点之间的相似性,并且采用相似性最高的邻居节点的标签来更新所述将要更新标签的节点的标签;其中,所述局部相似性计算公式为:其中,Vi表示所述将要更新标签的节点,Vj表示节点Vi的具有数量最多的标签的邻居节点,fij表示节点Vi与节点Vj的相似性,St(i)表示节点Vi的星形邻域子图,St(j)表示节点Vj的星形邻域子图,Ve∈St(i)∩St(j)表示在节点Vi与节点Vj的共同的邻居节点,ke表示节点Ve具有的连接数量。2.根据权利要求1所述的方法,其特征在于,在所述采用相似性最高的邻居节点的标签来更新所述将要更新标签的节点的标签的步骤之后,所述方法还包括:判断在社交网络图中的所有节点的标签是否变化:如果在社交网络图中的所有节点的标签中有节点的标签变化,则重新进行按照标签传播顺序更新节点的标签的步骤;如果在所述表示社交网络的社交网络图中的所有节点的标签不再变化或者更新节点的标签的次数达到预设的最大迭代次数,则根据节点的标签来划分节点在所述社交网络中所属的社区。3.根据权利要求2所述的方法,其中,所述按照标签传播顺序更新节点的标签的步骤,还包括:在统计在所述将要更新标签的节点的所有邻居节点的唯一的标签中的每种标签的数量之前,对在所述表示社交网络的社交网络图中的所有节点进行初始化,为所述表示社交网络的社交网络图中的各个节点分别分配唯一的标签。4.一种基于标签传播算法的社区发现装置,其特征在于,包括...
【专利技术属性】
技术研发人员:张典,
申请(专利权)人:郑州云海信息技术有限公司,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。