一种基于半监督标签传播的微博用户群体划分方法技术

技术编号:13593820 阅读:73 留言:0更新日期:2016-08-26 07:17
本发明专利技术涉及一种基于半监督标签传播的微博用户群体划分方法,该方法具体过程是:读取社交网络数据,构造以社交网络用户为节点、用户关系为边的社交网络图,为每一个用户随机赋予一个唯一的标签值,采用标签传播算法来更新用户节点的标签,在标签传播的过程中,当被更新节点邻居节点中存在多个具有最高频率标签时选择这些邻居节点中具有互为好友或加关注的邻居标签更新该节点的标签,对于经过几步的迭代更新后,紧密连接的节点将会拥有相同的特定标签值。根据本发明专利技术实施例的社会网络群体划分方法,根据用户关系图边聚集系数属性,通过改进标签传播算法,对用户群体进行划分,划分结果对网络舆情监测、商业用户挖掘等都具有较好的应用价值。

【技术实现步骤摘要】

本专利技术涉及社交网络
,特别是一种基于半监督标签传播的微博用户群体划分方法
技术介绍
如何从社会网络中挖掘出具有实用效益的信息已成为复杂网络中一个研究热点,无论在理论还是社会实用价值上都具有非常重要的意义。网络社区通常由功能相近或性质相似的网络节点组成,复杂网络中同一社区内的节点具有相似的特点或相似的兴趣。微博是一个典型的复杂网络,微博网络中的社区是由一组关注同一个话题或具有相似兴趣的用户组成的集合。通过挖掘微博网络中的社区结构,可以迅速而准确的找到具有相同或相似兴趣爱好的用户,发现他们共同参与的话题,这些对网络舆情监测、商业用户挖掘等领域都具有较好的应用价值。迄今为止,人们已经提出许多社区发现方法,2002年,Girvan和Newman在PNAS上发表的论文对社会网络和生物网络中的社区结构进行研究,也就是著名的GN算法,它是社区发现技术发展过程中的一个重要里程碑,也是一种非常经典的社区发现算法和社区发现技术研究中的重要的参考模型,该论文拉开了网络社区结构研究的序幕。该论文首次将网络社区结构作为网络普遍具有的拓扑特征提出,并给出一种基于边介数(edge betweenne本文档来自技高网...

【技术保护点】
一种基于半监督标签传播的微博用户群体划分方法,其特征在于,所述方法包括以下步骤:步骤A:读取微博网络数据,构造微博网络用户关系矩阵A={aij},当用户i与j为好友时aij=2,当i与j互为关注时aij=1,其它记为0;步骤B:读取微博网络数据,构造以微博网络用户为节点、用户关系为边的社交网络图;步骤C:节点标记:为每一个用户节点随机分配一个唯一的标签值,作为它所属社区的标识;步骤D:初步社区划分:对图中的所有顶点的标签进行迭代更新,每次迭代后,节点的标签值更新为其邻接节点的标签中数量最多的标签值;步骤E:社区划分细化:如果多个标签出现的频率最高时,查找用户关系矩阵,在具有标签频率最高的邻居节...

【技术特征摘要】
1.一种基于半监督标签传播的微博用户群体划分方法,其特征在于,所述方法包...

【专利技术属性】
技术研发人员:张贤坤任静牛四宝刘申
申请(专利权)人:天津科技大学
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1