定向局部群体发现方法技术

技术编号:14849156 阅读:55 留言:0更新日期:2017-03-18 09:03
本发明专利技术提供了一种定向局部群体发现方法,包括如下步骤:建立网络邻接矩阵和属性矩阵;基于一个反应定向目标的模范节点推断属性重要性权值向量;基于权值向量重新加权网络边权值;在重新加权网络上提取权值显著大的边组成群体种子;局部扩展群体种子最优化加权导率抽取定向局部群体;去除抽取出的定向局部群体中不重要的和重复的群体。本发明专利技术针对社交网络群体结构多样化及群体应用目标明确的特点,提出定向目标自适应推断方法,在推断出的目标子空间下重新加权网络,构建种子,基于局部扩展抽取定向局部群体,适合于具体的社会化应用目标。

【技术实现步骤摘要】
技术邻域本专利技术涉及社交网络
,具体地,涉及一种社交网络中定向局部群体发现方法,可用于社交网络功能分析、结构可视化和各种社交应用输入。
技术介绍
社交网络中的群体发现对理解网络功能、可视化网络结构及开发其他社交应用有重要作用。从结构上看,群体内部连接紧密,群体之间连接稀疏;从属性上看,群体内部在特定属性子空间上较均质。经对现有技术的文献检索发现,大部分群体发现方法仅考虑网络拓扑结构信息,并且只抽取一种固定的群体结构。事实上,由于社交网络的复杂和巨大性,其通常包含多种群体结构,并且不同的社交应用的目标不同,需要不同偏向的群体结构,因此需要基于特定的应用目标和用户兴趣抽取合适的定向局部群体。然而,很难仅基于网络结构信息就获得定向群体结构。如今,可以获得大量社交网络的属性信息,属性能够反应和描述应用目标和用户兴趣,因此提供了一种指引定向局部群体发现的方法。综合结构信息和属性信息的群体发现方法主要包括属性全空间法和属性子空间法。属性全空间法使用所有给的属性聚类节点集。Xu等人于2012年在国际会议《SIGMOD》上发表题为“Amodel-basedapproachtoattributedgraphclustering”的文章,文中采用一个贝叶斯模型来同时处理结构和所有属性信息;该模型为每一个可能的群体基于结构连接和所有属性分布分配一个概率,将群体发现问题转化成一个概率推断问题,并使用变分法解决。然而,并不是所有获得的属性和某个特定的目标有联系,全空间法通常辨别能力不足,导致发现不好的群体。另一方面,属性子空间法基于某个属性子空间聚类节点集。Huang等人于2015年在国际期刊《InformationScience》上发表题为“Densecommunitydetectioninmulti-valuedattributednetworks”的文章,文中采用基于单元的子空间聚类方法,发现在子空间里具有稠密连接的单元,要求群体满足子空间兴趣门限、覆盖率和连通性门限。然而,现有的子空间通常基于非监督特征选择机制选择,无法针对特定目标选择子空间。
技术实现思路
针对现有技术中的缺陷,本专利技术的目的是提供的定向局部群体发现方法,包括如下步骤:步骤1:建立待分析网络的邻接矩阵A和属性矩阵B;步骤2:用户提供一个反应定向目标的模范节点vp,本专利技术基于该节点推断其结构邻域内的属性重要性权值向量集;步骤3:判断权值向量集是否为空,若权值向量集非空,则进行步骤4;若权值向量集为空,则执行步骤13;步骤4:从权值向量集中取出一个权值向量步骤5:基于所述权值向量重新加权获得网络边综合权值;步骤6:在重新加权网络上提取权值显著大的边,并以所述边构建群体种子集;步骤7:判断群体种子集是否为空,若群体种子集非空,则执行步骤8;若群体种子集为空,则执行步骤12;步骤8:从群体种子集中取出一个群体种子;步骤9:判断所述群体种子是否属于已访问节点集,若不属于已访问节点集,则执行步骤10;若属于已访问节点集,则返回执行步骤7;步骤10:局部扩展所述群体种子直到该种子所代表的群体的加权导率最小,此时获得一个定向局部群体,群体的加权导率定义为该群体的加权割与该群体的加权体积之比;步骤11:将定向局部群体加入所述权值向量下的定向局部群体集,更新已访问节点集;步骤12:去除所述权值向量下定向局部群体集中不重要的和重复的定向局部群体,不重要的群体是那些内部边权值之和与网络所有边权值之和之比小于一个显著性门限的群体,重复的群体是那些和已存在群体集中的群体之间交集的规模大于一个重复门限的群体;步骤13:输出所有定向局部群体集。优选地,所述步骤1中的邻接矩阵A编码网络结构信息,矩阵内的任一元素Aij代表边(vi,vj)的拓扑权值,当值为0时,表示对应节点对之间不存在边,属性矩阵B编码网络属性信息,属性矩阵B内的任一元素Bip表示第i个节点的第p个属性值。优选地,所述步骤2包括:基于一个反应定向目标的模范节点vp推断属性重要性权值向量集Φ,其中:式中:表示第k个权值向量,表示某个权值向量中第q个属性的权值,q表示属性索引,t表示属性个数,SDq表示榜样节点集在第q个属性上的相似度;具体地,包括:步骤2.1:在网络中随机采样|PR|个节点对组成随机节点对集,|PR|表示随机节点对集中节点对的个数;步骤2.2:计算所有随机节点对属性值之差的平方和RSumq,计算规范化因子δq=RSumq/|PR|;步骤2.3:抽出模范节点的邻域网络,即所有和模范节点相连的节点组成的网络,在邻域网络上划分出邻域群体集NCS(vp);步骤2.4:判断邻域群体集是否为空,若不为空则执行步骤2.5,否则结束步骤2;步骤2.5:从邻域群体集中取出一个邻域群体NCk,判断邻域群体内部节点数量是否大于CSl,若是则进行2.6,否则返回步骤2.4;步骤2.6:随机选取所述邻域群体中CSl个节点组成榜样节点集,榜样节点集中所有任意两个节点组成的节点对组成相似节点对集;步骤2.7:计算所有相似节点对属性值之差的平方和SSumq;步骤2.8:计算榜样节点集在第q个属性上的相似度步骤2.9:计算第q个属性的重要性权值优选地,所述步骤5包括:步骤5.1:计算网络中每条边的属性距离式中:Bi表示第i个节点的属性向量,Bj表示第j个节点的属性向量,表示对角线是的对角矩阵,(Bi-Bj)T表示第i个节点属性向量与第j个节点属性向量之差的转置;步骤:5.2:计算每条边的权值,即基于所述权值向量重新加权网络边权值W={Wij本文档来自技高网
...

【技术保护点】
一种定向局部群体发现方法,其特征在于,包括如下步骤:步骤1:建立待分析网络的邻接矩阵A和属性矩阵B;步骤2:用户提供一个反应定向目标的模范节点vp,本专利技术基于该节点推断其结构邻域内的属性重要性权值向量集;步骤3:判断权值向量集是否为空,若权值向量集非空,则进行步骤4;若权值向量集为空,则执行步骤13;步骤4:从权值向量集中取出一个权值向量步骤5:基于所述权值向量重新加权获得网络边综合权值;步骤6:在重新加权网络上提取权值显著大的边,并以所述边构建群体种子集;步骤7:判断群体种子集是否为空,若群体种子集非空,则执行步骤8;若群体种子集为空,则执行步骤12;步骤8:从群体种子集中取出一个群体种子;步骤9:判断所述群体种子是否属于已访问节点集,若不属于已访问节点集,则执行步骤10;若属于已访问节点集,则返回执行步骤7;步骤10:局部扩展所述群体种子直到该种子所代表的群体的加权导率最小,此时获得一个定向局部群体,群体的加权导率定义为该群体的加权割与该群体的加权体积之比;步骤11:将定向局部群体加入所述权值向量下的定向局部群体集,更新已访问节点集;步骤12:去除所述权值向量下定向局部群体集中不重要的和重复的定向局部群体,不重要的群体是那些内部边权值之和与网络所有边权值之和之比小于一个显著性门限的群体,重复的群体是那些和已存在群体集中的群体之间交集的规模大于一个重复门限的群体;步骤13:输出所有定向局部群体集。...

【技术特征摘要】
1.一种定向局部群体发现方法,其特征在于,包括如下步骤:
步骤1:建立待分析网络的邻接矩阵A和属性矩阵B;
步骤2:用户提供一个反应定向目标的模范节点vp,本发明基于该节点推断其结构邻域
内的属性重要性权值向量集;
步骤3:判断权值向量集是否为空,若权值向量集非空,则进行步骤4;若权值向量集为
空,则执行步骤13;
步骤4:从权值向量集中取出一个权值向量步骤5:基于所述权值向量重新加权获得网络边综合权值;
步骤6:在重新加权网络上提取权值显著大的边,并以所述边构建群体种子集;
步骤7:判断群体种子集是否为空,若群体种子集非空,则执行步骤8;若群体种子集为
空,则执行步骤12;
步骤8:从群体种子集中取出一个群体种子;
步骤9:判断所述群体种子是否属于已访问节点集,若不属于已访问节点集,则执行步
骤10;若属于已访问节点集,则返回执行步骤7;
步骤10:局部扩展所述群体种子直到该种子所代表的群体的加权导率最小,此时获得
一个定向局部群体,群体的加权导率定义为该群体的加权割与该群体的加权体积之比;
步骤11:将定向局部群体加入所述权值向量下的定向局部群体集,更新已访问节点
集;
步骤12:去除所述权值向量下定向局部群体集中不重要的和重复的定向局部群体,不
重要的群体是那些内部边权值之和与网络所有边权值之和之比小于一个显著性门限的群
体,重复的群体是那些和已存在群体集中的群体之间交集的规模大于一个重复门限的群
体;
步骤13:输出所有定向局部群体集。
2.根据权利要求1所述的定向局部群体发现方法,其特征在于,所述步骤1中的邻接矩
阵A编码网络结构信息,矩阵内的任一元素Aij代表边(vi,vj)的拓扑权值,当值为0时,表示
对应节点对之间不存在边,属性矩阵B编码网络属性信息,属性矩阵B内的任...

【专利技术属性】
技术研发人员:潘理吴鹏
申请(专利权)人:上海交通大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1