社区发现方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:23213587 阅读:32 留言:0更新日期:2020-01-31 22:09
本申请涉及大数据处理领域,具体是一种社区发现方法、装置、计算机设备和存储介质。所述方法包括:从关联数据库中提取关联数据,根据关联数据建立包括节点集群和向量的关系网络图,按照预先设置的更新规则对关系网络图中的每个节点的类别标签进行更新,并记录每个节点更新后的类别标签,得到更新后的节点集群;从更新后的节点集群中确定出类别标签发生变化的目标节点,并统计目标节点在所述更新后的节点集群中的比例值;判断比例值是否小于等于预设阀值;若比例值小于等于预设阀值,则将更新后的类别标签相同的节点聚类为一个社区,将聚类完成的社区发送给终端进行显示。采用本方法能够提高所发现的社区的稳定性,从而提高所发现社区的准确性。

Community discovery methods, devices, computer equipment and storage media

【技术实现步骤摘要】
社区发现方法、装置、计算机设备和存储介质
本申请涉及大数据处理
,特别是涉及一种社区发现方法、装置、计算机设备和存储介质。
技术介绍
在复杂的社会关系网络结构中,社区发现对社会关系特征分析具有重要意义。社区关系网络结构中的主体、主体与主体之间的关系构成图数据。图数据由节点和边组成,图中的节点表示发生连接的主体,边表示主体之间的关联。图数据内部连接比较紧密的节点子集合对应的子图叫做社区(community),对给定的图数据寻找其社区结构的过程称为“社区发现”。大体上看,社区发现的过程就是一种聚类的过程。目前的社区发现普遍使用的方法是标准的类别标签传播算法,通过预设迭代次数作为类别标签传播算法的终止条件。类别标签传播方法为一种分布式的社团发现方法,其核心思想是预设迭代次数,在首次迭代时,为所有类别标签指定一个唯一类别标签;在每次迭代刷新时,对于某一个节点,考察其所有邻居节点的类别标签,并进行统计,将出现个数最多的那个类别标签赋给当前节点,当个数最多的类别标签不唯一时,随机选一个,直到达到预设迭代次数后,将相同类别标签的节点聚类为一个社本文档来自技高网...

【技术保护点】
1.一种社区发现方法,所述方法包括:/n从关联数据库中提取关联数据,所述关联数据包括至少两个身份标识以及所述至少两个身份标识之间的关系记录;/n根据所述关联数据建立包括节点集群和向量的关系网络图,所述节点集群中的每个节点用于表征所述身份标识,所述向量用于表征所述关系记录;/n为所述关系网络图中的每个所述节点建立对应的类别标签;/n按照预先设置的更新规则对所述关系网络图中的每个所述节点的类别标签进行更新,并记录每个所述节点更新后的类别标签,得到更新后的节点集群;/n从所述更新后的节点集群中确定出类别标签发生变化的目标节点,并统计所述目标节点在所述更新后的节点集群中的比例值;/n判断所述比例值是否...

【技术特征摘要】
1.一种社区发现方法,所述方法包括:
从关联数据库中提取关联数据,所述关联数据包括至少两个身份标识以及所述至少两个身份标识之间的关系记录;
根据所述关联数据建立包括节点集群和向量的关系网络图,所述节点集群中的每个节点用于表征所述身份标识,所述向量用于表征所述关系记录;
为所述关系网络图中的每个所述节点建立对应的类别标签;
按照预先设置的更新规则对所述关系网络图中的每个所述节点的类别标签进行更新,并记录每个所述节点更新后的类别标签,得到更新后的节点集群;
从所述更新后的节点集群中确定出类别标签发生变化的目标节点,并统计所述目标节点在所述更新后的节点集群中的比例值;
判断所述比例值是否小于等于预设阀值;
若所述比例值小于等于所述预设阀值,则将更新后的类别标签相同的节点聚类为一个社区,将聚类完成的社区发送至终端进行显示。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述比例值大于所述预设阀值,则对所述关系网络图中的每个所述节点的类别标签再次进行更新,直至更新后所述类别标签发生变化的节点的数量对应的比例值小于等于所述预设阀值;
将更新后的类别标签相同的节点聚类为一个社区,将聚类完成的社区发送至终端进行显示。


3.根据权利要求1所述的方法,其特征在于,所述根据所述关联数据建立包括节点集群和向量的关系网络图,包括:
将存在所述关系记录的所述身份标识映射为关系网络图中的节点;
将所述关系记录映射为所述关系网络图中的所述节点之间相互连接的向量;
将通过所述向量连接的两个节点之间的关系记录的数量作为连接所述两个节点的向量的权重值。


4.根据权利要求3所述的方法,其特征在于,所述按照预先设置的更新规则对所述关系网络图中的每个所述节点的类别标签进行更新,包括:
获取节点对应的邻接节点,所述邻接节点是与所述节点存在关系记录的节点;
判断所述邻接节点中数量最多的类别标签是否为一个,若是,则通过数量最多的类别标签替换所述节点的类别标签完成更新。


5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
若所述邻接节点中数量最多的类别标签不止一个,则根据数量最多的类别标签对应的邻接节点生成邻接节点集合,获取所述邻接节点集合中与所述节点连接的权重值最大的向量对应的邻接节点是否为一个;
若所述邻接节点集合中与所述节点连接的权重值...

【专利技术属性】
技术研发人员:邓强张娟屠宁赵之砚施奕明
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1