【技术实现步骤摘要】
一种社群划分方法、装置、存储介质及电子装置
本专利技术涉及信息
,具体而言,涉及一种社群划分方法、装置、存储介质及电子装置。
技术介绍
社群是由无数群成员构成的,而社群的KOL就是这些社群成员的连接点,KOL的意思是舆论领袖,这个群体往往拥有非常广阔的人脉,大家对他们通常会比较服气。社群管理者可以通过找出这些KOL,让他们定时通过文字或是直播的方式分享一些经验和内容,这样的话在提升了社群活跃度的同时,还能够让社群的价值进一步提升。社区发现用来发现网络中的社区结构,也可以看作是一种聚类算法。现有的划分方法,过于依赖人的主观判断,不能及时动态的反映社群的发展情况和动态结构。在现有的实际运作过程中,主要通过以下两种方法划分社群:1、图分割法图分割方法大多是基于迭代二分法的,基本思想是将图分割成两个子图,然后迭代,最后得出要求的子图数。经典的算法有Kernighan-Lin算法和谱二分算法。K-L(Kernighan-Lin)算法是一种将已知网络划分为已知大小的两个社区的二分方法,它是一种贪婪算法。它的主要思想是为网络划分定义了一个函数增益Q,Q表示的是社区内部的边数与社区之间的边数之差,根据这个方法找出使增益函数Q的值成为最大值的划分社区的方法。具体策略是,将社区结构中的结点移动到其他的社区结构中或者交换不同社区结构中的结点。从初始解开始搜索,直到从当前的解出发找不到更优的候选解,然后停止。谱二分算法,当网络中存在两个社区结构时,就能够根据非零特征值所对应的特征 ...
【技术保护点】
1.一种社群划分方法,其特征在于,包括:/n将关系数据处理为图结构数据;/n统计所述图结构数据的联通性,将所述图结构数据划分为第一社群集合,其中,所述第一社群集合包括第一数量的社群;/n在所述第一数量小于预先设置的社群数量的情况下,通过标签传播算法LPA将所述图结构数据划分为第二社群集合,其中,所述第二社群集合包括第二数量的社群,所述第二数量大于或等于所述预先设置的社群数量;对所述第二社群集合中的社群进行中心度计算,确定所述第二社群集合中社群的中心点;和/或,/n在所述第一数量大于或等于所述预先设置的社群数量的情况下,对所述第一社群集合中的社群进行中心度计算,确定所述第一社群集合中社群的中心点。/n
【技术特征摘要】
1.一种社群划分方法,其特征在于,包括:
将关系数据处理为图结构数据;
统计所述图结构数据的联通性,将所述图结构数据划分为第一社群集合,其中,所述第一社群集合包括第一数量的社群;
在所述第一数量小于预先设置的社群数量的情况下,通过标签传播算法LPA将所述图结构数据划分为第二社群集合,其中,所述第二社群集合包括第二数量的社群,所述第二数量大于或等于所述预先设置的社群数量;对所述第二社群集合中的社群进行中心度计算,确定所述第二社群集合中社群的中心点;和/或,
在所述第一数量大于或等于所述预先设置的社群数量的情况下,对所述第一社群集合中的社群进行中心度计算,确定所述第一社群集合中社群的中心点。
2.根据权利要求1所述的方法,其特征在于,通过标签传播算法LPA将所述图结构数据划分为第二社群集合包括:
为所述图结构数据中每个节点配置一个标签;
对所述每个节点执行以下步骤,对于执行以下步骤的节点称为当前节点:
重复统计所述当前节点的邻居节点的标签,将出现次数最多的邻居节点的标签更新所述当前节点的标签,直到所述当前节点的标签为邻居节点的标签中出现次数最多或最多的之一;
将具有相同标签的节点划分到同一个社群中,得到所述多个第二社群。
3.根据权利要求2所述的方法,其特征在于,将出现次数最多的邻居节点的标签更新所述当前节点的标签包括:
在出现次数最多的邻居节点的标签为多个的情况下,从出现次数最多的多个邻居节点的标签中随机选择一个邻居节点的标签确定为所述当前节点的标签。
4.根据权利要求2所述的方法,其特征在于,为所述图结构数据中的每个节点配置一个标签包括:
将所述图结构数据中每个节点的节点标识ID配置为所述每个节点的标签ID。
5.根据权利要求1所述的方法,其特征在于,在通过标签传播算法LPA将所述图结构数据划分为第二社群集合之后,所述方法还包括:
组合所述第二社群集合的社群中包含社群中所有节点的所有边,重新构建第三社群集合,其中,所述第三社群集合包括第三数量的社群;
对所述第三社群集合中的社群进行连通性分析,保留节点数量最多的社群,得到第四社群集合,并将出所述第四社群集合的社群的节点之外的其他节点的标签清零,其中,所述第四社群集合包括第四数量的社群;
对所述第二社群集合中的社群进行中心...
【专利技术属性】
技术研发人员:姜旭,李嘉琛,
申请(专利权)人:北京明略软件系统有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。