一种社群划分方法、装置、存储介质及电子装置制造方法及图纸

技术编号：24169384 阅读：26 留言：0更新日期：2020-05-16 02:27

本发明专利技术提供了一种社群划分方法、装置、存储介质及电子装置，该方法包括：将关系数据处理为图结构数据；统计该图结构数据的联通性，将该图结构数据划分为第一社群集合；在该第一数量小于预先设置的社群数量的情况下，通过标签传播算法LPA将该图结构数据划分为第二社群集合；对该第二社群集合中的社群进行中心度计算，确定该第二社群集合中社群的中心点；和/或，在该第一数量大于或等于该预先设置的社群数量的情况下，对该第一社群集合中的社群进行中心度计算，确定该第一社群集合中社群的中心点，可以解决相关技术中通过GN算法划分社群存在时间复杂度太高，且不知道最后会有多少社群的问题，提高了社群划分的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种社群划分方法、装置、存储介质及电子装置
本专利技术涉及信息
，具体而言，涉及一种社群划分方法、装置、存储介质及电子装置。
技术介绍
社群是由无数群成员构成的，而社群的KOL就是这些社群成员的连接点，KOL的意思是舆论领袖，这个群体往往拥有非常广阔的人脉，大家对他们通常会比较服气。社群管理者可以通过找出这些KOL，让他们定时通过文字或是直播的方式分享一些经验和内容，这样的话在提升了社群活跃度的同时，还能够让社群的价值进一步提升。社区发现用来发现网络中的社区结构，也可以看作是一种聚类算法。现有的划分方法，过于依赖人的主观判断，不能及时动态的反映社群的发展情况和动态结构。在现有的实际运作过程中，主要通过以下两种方法划分社群：1、图分割法图分割方法大多是基于迭代二分法的，基本思想是将图分割成两个子图，然后迭代，最后得出要求的子图数。经典的算法有Kernighan-Lin算法和谱二分算法。K-L(Kernighan-Lin)算法是一种将已知网络划分为已知大小的两个社区的二分方法...

【技术保护点】
1.一种社群划分方法，其特征在于，包括：/n将关系数据处理为图结构数据；/n统计所述图结构数据的联通性，将所述图结构数据划分为第一社群集合，其中，所述第一社群集合包括第一数量的社群；/n在所述第一数量小于预先设置的社群数量的情况下，通过标签传播算法LPA将所述图结构数据划分为第二社群集合，其中，所述第二社群集合包括第二数量的社群，所述第二数量大于或等于所述预先设置的社群数量；对所述第二社群集合中的社群进行中心度计算，确定所述第二社群集合中社群的中心点；和/或，/n在所述第一数量大于或等于所述预先设置的社群数量的情况下，对所述第一社群集合中的社群进行中心度计算，确定所述第一社群集合中社群的中心点...

【技术特征摘要】
1.一种社群划分方法，其特征在于，包括：
将关系数据处理为图结构数据；
统计所述图结构数据的联通性，将所述图结构数据划分为第一社群集合，其中，所述第一社群集合包括第一数量的社群；
在所述第一数量小于预先设置的社群数量的情况下，通过标签传播算法LPA将所述图结构数据划分为第二社群集合，其中，所述第二社群集合包括第二数量的社群，所述第二数量大于或等于所述预先设置的社群数量；对所述第二社群集合中的社群进行中心度计算，确定所述第二社群集合中社群的中心点；和/或，
在所述第一数量大于或等于所述预先设置的社群数量的情况下，对所述第一社群集合中的社群进行中心度计算，确定所述第一社群集合中社群的中心点。

2.根据权利要求1所述的方法，其特征在于，通过标签传播算法LPA将所述图结构数据划分为第二社群集合包括：
为所述图结构数据中每个节点配置一个标签；
对所述每个节点执行以下步骤，对于执行以下步骤的节点称为当前节点：
重复统计所述当前节点的邻居节点的标签，将出现次数最多的邻居节点的标签更新所述当前节点的标签，直到所述当前节点的标签为邻居节点的标签中出现次数最多或最多的之一；
将具有相同标签的节点划分到同一个社群中，得到所述多个第二社群。

3.根据权利要求2所述的方法，其特征在于，将出现次数最多的邻居节点的标签更新所述当前节点的标签包括：
在出现次数最多的邻居节点的标签为多个的情况下，从出现次数最多的多个邻居节点的标签中随机选择一个邻居节点的标签确定为所述当前节点的标签。

4.根据权利要求2所述的方法，其特征在于，为所述图结构数据中的每个节点配置一个标签包括：
将所述图结构数据中每个节点的节点标识ID配置为所述每个节点的标签ID。

5.根据权利要求1所述的方法，其特征在于，在通过标签传播算法LPA将所述图结构数据划分为第二社群集合之后，所述方法还包括：
组合所述第二社群集合的社群中包含社群中所有节点的所有边，重新构建第三社群集合，其中，所述第三社群集合包括第三数量的社群；
对所述第三社群集合中的社群进行连通性分析，保留节点数量最多的社群，得到第四社群集合，并将出所述第四社群集合的社群的节点之外的其他节点的标签清零，其中，所述第四社群集合包括第四数量的社群；
对所述第二社群集合中的社群进行中心...

【专利技术属性】
技术研发人员：姜旭，李嘉琛，
申请(专利权)人：北京明略软件系统有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人