一种基于特定用户的群体关系挖掘与分析方法技术

技术编号:23558320 阅读:36 留言:0更新日期:2020-03-25 03:54
本发明专利技术提出了一种基于特定用户的群体关系挖掘与分析方法,包括如下步骤:选取一定数量的具有相同特征或共同行为的用户作为特定用户;利用改进的最短路径图聚类算法去挖掘关联所述特定用户之间的关系,形成初级群体;对节点进行属性特征分析,将所述初级群体中的所述用户节点属性特征标签构造成初级群体属性比对集合;获得候选扩展用户及其属性集合,计算所述候选扩展用户的属性与所述初级群体比对集合属性间的相似度,选取相似度大于阈值的候选扩展用户加入到所述初级群体中。本发明专利技术结合群体关系结构的内聚性以及个体在特定属性子集的相似性的来挖掘群体,聚类效果良好。

A method of mining and analyzing group relationship based on specific users

【技术实现步骤摘要】
一种基于特定用户的群体关系挖掘与分析方法
本专利技术涉及社交网络领域,尤其涉及在社交网络中对群体关系进行挖掘与分析的方法。
技术介绍
长期以来,社交网络群体发现就是把群体作为检索目标,利用群体在关系结构或者个体属性上的可挖掘特征作为发现基础,对具有特定组织结构或属性特征的用户子集进行挖掘的过程。现有技术中社交网络群体发现方法通常有两类,分别是基于群体结构的图聚类算法和基于个体属性特征的聚类算法。对于基于群体结构的图聚类算法,是社交网络中的群体挖掘通常采用的方法,其利用群体之间的结构关系,对群体进行聚类分析。图聚类算法也常被用在社交网络分析中,它用节点表示网络中的用户,节点之间的联系表示用户之间的交互关系,最终形成复杂的网络图。图聚类算法是聚类分析算法中的一种类型。对于不同规模的数据集、不同数据集可视化方式、不同数据集的应用场景,分别使用不同的图聚类算法。根据不同的方式,可以将图聚类算法分为基于随机流的算法、基于划分的算法、基于谱聚类的算法和基于层次的算法。马尔可夫聚类算法(MCL)是一种快速且可扩展的图聚类算法,该算法基于模拟随机流,不本文档来自技高网...

【技术保护点】
1.一种社交网络中对群体关系进行挖掘与分析的方法,所述社交网络中的用户使用节点进行表示,所述方法包括如下步骤:/n1)特定用户选取:选取一定数量的具有相同特征或共同行为的用户作为特定用户;/n2)关联特定用户:利用改进的最短路径图聚类算法去挖掘关联所述第1)步中所选取出的所述特定用户之间的关系,对所述特定用户进行关系关联,并形成初级群体;/n3)群体特征分析:对用户进行属性特征分析,以打标签的形式进行描述,将所述初级群体中的所述用户节点属性特征标签构造成初级群体属性比对集合(S

【技术特征摘要】
1.一种社交网络中对群体关系进行挖掘与分析的方法,所述社交网络中的用户使用节点进行表示,所述方法包括如下步骤:
1)特定用户选取:选取一定数量的具有相同特征或共同行为的用户作为特定用户;
2)关联特定用户:利用改进的最短路径图聚类算法去挖掘关联所述第1)步中所选取出的所述特定用户之间的关系,对所述特定用户进行关系关联,并形成初级群体;
3)群体特征分析:对用户进行属性特征分析,以打标签的形式进行描述,将所述初级群体中的所述用户节点属性特征标签构造成初级群体属性比对集合(S1,S2...Sn);
4)群体扩展:获得所述初级群体的用户对应的好友,作为候选扩展用户,获得所述候选扩展用户的属性集合,并设置所述候选扩展用户属性集合的动态权重值,将所述候选扩展用户的属性集合与所述初级群体比对集合进行比较,计算所述候选扩展用户的属性与所述初级群体比对集合属性间的相似度,选取相似度大于阈值的候选扩展用户作为扩展用户,并将所述扩展用户加入到所述初级群体中,得到一次扩展结果;
5)循环执行第4)步的所述群体扩展,直到达到预设的扩展关系层次数,得到最终的扩展结果作为群体关系挖掘结果。


2.如权利要求1所述的方法,所述步骤1)中特定用户的数量根据具体群体的类型与大小确定。


3.如权利要求1所述的方法,所述步骤2)中根据改进的最短路径图聚类算法获得初级群体的方法包括以下步骤:
a.在由用户节点构成的带权值无向图中,将所有的边权值设为默认值2,在挖掘所述特定用户关系时,将所述特定用户所有直接关系的边权值改为1;<...

【专利技术属性】
技术研发人员:曹金璇杜彦辉芦天亮陈志扬
申请(专利权)人:中国人民公安大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1