重叠社区检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35976789 阅读:42 留言:0更新日期:2022-12-17 22:45
本发明专利技术提供一种重叠社区检测方法、装置、电子设备及存储介质,重叠社区检测方法包括:基于PageRank算法,确定目标网络中各节点的标签的更新顺序;基于所述更新顺序,对所述目标网络中各节点的标签进行目标次数的更新,获取各节点的标签列表;基于所述各节点的标签列表,获取所述目标网络的重叠社区检测结果。本发明专利技术提供的重叠社区检测方法、装置、电子设备及存储介质,通过确定目标网络中各节点的标签的更新顺序,基于更新顺序进行标签传播,能降低标签传播过程中节点间形成的干扰力,能消除通常的标签传播算法因随机确定更新顺序造成的不稳定性,能获得更稳定、准确的重叠社区检测结果。测结果。测结果。

【技术实现步骤摘要】
重叠社区检测方法、装置、电子设备及存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种重叠社区检测方法、装置、电子设备及存储介质。

技术介绍

[0002]复杂网络的社区识别已成为大数据领域研究的热点问题之一,它对于复杂网络的拓扑结构分析、功能分析和行为预测都具有重要的理论意义和行为意义。社区由一系列特定的节点组织构成,学术上称之为“社区化”。
[0003]内部社区间共同享有网络中的关键节点,具有该特征的社区叫做重叠社区,而这些共享的关键节点叫做重叠节点。现有重叠社区检测方法通常是基于SLPA(Speaker

listener Label Propagation Algorithm)实现的,但基于SLPA的重叠社区检测的检测结果不稳定,即对相同的网络进行多次检测获得的检测结果的差异可能很大。

技术实现思路

[0004]本专利技术提供一种重叠社区检测方法、装置、电子设备及存储介质,用以解决现有技术中检测结果不稳定的缺陷,实现获得稳定性更好的重叠社区检测结果。
[0005]第一方面,本专利技术提供一种重叠社区检测方法,包括:
[0006]基于PageRank算法,确定目标网络中各节点的标签的更新顺序;
[0007]基于所述更新顺序,对所述目标网络中各节点的标签进行目标次数的更新,获取各节点的标签列表;
[0008]基于所述各节点的标签列表,获取所述目标网络的重叠社区检测结果。
[0009]在一个实施例中,更新所述节点的标签,具体包括:
[0010]在本次更新传播至所述节点的标签中出现频次最高的标签不少于2个的情况下,分别获取所述节点与所述出现频次最高的标签对应的每一邻居节点之间的相似性;
[0011]基于所述相似性,确定本次更新所述节点的标签的结果。
[0012]在一个实施例中,所述基于PageRank算法,确定目标网络中各节点的标签的更新顺序,具体包括:
[0013]所述基于PageRank算法,通过迭代,分别获取每一所述节点的PR值;
[0014]基于各所述节点的PR值,确定所述更新顺序。
[0015]在一个实施例中,每次迭代,获取节点i的PR值的公式为
[0016][0017]其中,PR(i)表示节点i的PR值;n表示目标网络中节点的数量;α为预设的常数,0<α<1;M(i)表示节点i的邻居节点的集合;节点j是节点i的邻居节点;PR(j)表示节点j的PR值;d(j)表示节点j的度。
[0018]在一个实施例中,获取所述节点与所述出现频次最高的标签对应的邻居节点之间
的相似性的公式为
[0019][0020]其中,节点j是节点i的邻居节点;sim(i,j)表示节点i与节点j之间的相似性;Γ(i)表示节点i的邻居节点的集合;Γ(j)表示节点j的邻居节点的集合。
[0021]在一个实施例中,所述基于所述相似性,确定本次更新所述节点的标签的结果,具体包括:
[0022]在所述相似性的最大值的出现频次为1的情况下,将所述最大值对应的标签确定为本次更新所述节点的标签的结果。
[0023]在一个实施例中,所述基于所述相似性,确定本次更新所述节点的标签的结果,还包括:
[0024]在所述相似性的最大值的出现频次大于1的情况下,将所述最大值对应的任一标签确定为本次更新所述节点的标签的结果。
[0025]第二方面,本专利技术提供一种重叠社区检测装置,包括:
[0026]顺序确定模块,用于基于PageRank算法,确定目标网络中各节点的标签的更新顺序;
[0027]标签传播模块,用于基于所述更新顺序,对所述目标网络中各节点的标签进行目标次数的更新,获取各节点的标签列表;
[0028]社区检测模块,用于基于所述各节点的标签列表,获取所述目标网络的重叠社区检测结果。
[0029]第三方面,本专利技术提供一种电子设备,包括处理器和存储有计算机程序的存储器,所述处理器执行所述计算机程序时实现上述任一种所述重叠社区检测方法的步骤。
[0030]第四方面,本专利技术提供一种处理器可读存储介质,所述处理器可读存储介质存储有计算机程序,所述计算机程序用于使所述处理器执行上述任一种所述重叠社区检测方法的步骤。
[0031]本专利技术提供的重叠社区检测方法、装置、电子设备及存储介质,通过确定目标网络中各节点的标签的更新顺序,基于更新顺序进行标签传播,能降低标签传播过程中节点间形成的干扰力,能消除通常的标签传播算法因随机确定更新顺序造成的不稳定性,能获得更稳定、准确的重叠社区检测结果。并且,能在一定程度上提高重叠社区检测的效率。
附图说明
[0032]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0033]图1是本专利技术提供的重叠社区检测方法的流程示意图;
[0034]图2是本专利技术提供的重叠社区检测方法的流程示意图;
[0035]图3是本专利技术提供的目标网络的结构示意图;
[0036]图4是本专利技术提供的重叠社区检测装置的结构示意图;
[0037]图5是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0038]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0039]下面结合图1

图5描述本专利技术的重叠社区检测方法、装置、电子设备及存储介质。
[0040]图1是本专利技术提供的重叠社区检测方法的流程示意图。下面结合图1描述本申请实施例提供的重叠社区检测方法。如图1所示,该方法包括:步骤101、基于PageRank算法,确定目标网络中各节点的标签的更新顺序。
[0041]具体地,目标网络是无向网络,该网络包括多个节点和至少一条条边。对于任一节点,存在至少一个邻居节点,且该节点与该节点的每一邻居节点分别通过一条边连接。
[0042]通常的PageRank算法,用于为每个网页附加权值。
[0043]PageRank算法的核心思想包括:
[0044](1)如果一个网页被很多其他网页链接到的话,说明这个网页比较重要,也就是PageRank值(即PR值或权值)会相对较高;
[0045](2)如果一个PageRank值很高的网页链接到一个其他的网页,那么被链接到的网页的PageRank值会相应地因此而提高。
[0046]本专利技术实施例中,可以基于PageRank算本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种重叠社区检测方法,其特征在于,包括:基于PageRank算法,确定目标网络中各节点的标签的更新顺序;基于所述更新顺序,对所述目标网络中各节点的标签进行目标次数的更新,获取各节点的标签列表;基于所述各节点的标签列表,获取所述目标网络的重叠社区检测结果。2.根据权利要求1所述的重叠社区检测方法,其特征在于,更新所述节点的标签,具体包括:在本次更新传播至所述节点的标签中出现频次最高的标签不少于2个的情况下,分别获取所述节点与所述出现频次最高的标签对应的每一邻居节点之间的相似性;基于所述相似性,确定本次更新所述节点的标签的结果。3.根据权利要求1或2所述的重叠社区检测方法,其特征在于,所述基于PageRank算法,确定目标网络中各节点的标签的更新顺序,具体包括:所述基于PageRank算法,通过迭代,分别获取每一所述节点的PR值;基于各所述节点的PR值,确定所述更新顺序。4.根据权利要求3所述的重叠社区检测方法,其特征在于,每次迭代,获取节点i的PR值的公式为其中,PR(i)表示节点i的PR值;n表示目标网络中节点的数量;α为预设的常数,0<α<1;M(i)表示节点i的邻居节点的集合;节点j是节点i的邻居节点;PR(j)表示节点j的PR值;d(j)表示节点j的度。5.根据权利要求2所述的重叠社区检测方法,其特征在于,获取所述节点与所述出现频次最高的标签对应的邻居节点之间的相似性的公式为其中,节点...

【专利技术属性】
技术研发人员:张静宜
申请(专利权)人:中移雄安信息通信科技有限公司中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1