定向局部群体发现方法技术

技术编号：14849156 阅读：55 留言：0更新日期：2017-03-18 09:03

本发明专利技术提供了一种定向局部群体发现方法，包括如下步骤：建立网络邻接矩阵和属性矩阵；基于一个反应定向目标的模范节点推断属性重要性权值向量；基于权值向量重新加权网络边权值；在重新加权网络上提取权值显著大的边组成群体种子；局部扩展群体种子最优化加权导率抽取定向局部群体；去除抽取出的定向局部群体中不重要的和重复的群体。本发明专利技术针对社交网络群体结构多样化及群体应用目标明确的特点，提出定向目标自适应推断方法，在推断出的目标子空间下重新加权网络，构建种子，基于局部扩展抽取定向局部群体，适合于具体的社会化应用目标。

全部详细技术资料下载

【技术实现步骤摘要】
技术邻域本专利技术涉及社交网络
，具体地，涉及一种社交网络中定向局部群体发现方法，可用于社交网络功能分析、结构可视化和各种社交应用输入。
技术介绍
社交网络中的群体发现对理解网络功能、可视化网络结构及开发其他社交应用有重要作用。从结构上看，群体内部连接紧密，群体之间连接稀疏；从属性上看，群体内部在特定属性子空间上较均质。经对现有技术的文献检索发现，大部分群体发现方法仅考虑网络拓扑结构信息，并且只抽取一种固定的群体结构。事实上，由于社交网络的复杂和巨大性，其通常包含多种群体结构，并且不同的社交应用的目标不同，需要不同偏向的群体结构，因此需要基于特定的应用目标和用户兴趣抽取合适的定向局部群体。然而，很难仅基于网络结构信息就获得定向群体结构。如今，可以获得大量社交网络的属性信息，属性能够反应和描述应用目标和用户兴趣，因此提供了一种指引定向局部群体发现的方法。综合结构信息和属性信息的群体发现方法主要包括属性全空间法和属性子空间法。属性全空间法使用所有给的属性聚类节点集。Xu等人于2012年在国际会议《SIGMOD》上发表题为“Amodel-basedapproachtoattributedgraphclustering”的文章，文中采用一个贝叶斯模型来同时处理结构和所有属性信息；该模型为每一个可能的群体基于结构连接和所有属性分布分配一个概率，将群体发现问题转化成一个概率推断问题，并使用变分法解决。然而，并不是所有获得的属性...

【技术保护点】
一种定向局部群体发现方法，其特征在于，包括如下步骤：步骤1：建立待分析网络的邻接矩阵A和属性矩阵B；步骤2：用户提供一个反应定向目标的模范节点vp，本专利技术基于该节点推断其结构邻域内的属性重要性权值向量集；步骤3：判断权值向量集是否为空，若权值向量集非空，则进行步骤4；若权值向量集为空，则执行步骤13；步骤4：从权值向量集中取出一个权值向量步骤5：基于所述权值向量重新加权获得网络边综合权值；步骤6：在重新加权网络上提取权值显著大的边，并以所述边构建群体种子集；步骤7：判断群体种子集是否为空，若群体种子集非空，则执行步骤8；若群体种子集为空，则执行步骤12；步骤8：从群体种子集中取出一个群体种子；步骤9：判断所述群体种子是否属于已访问节点集，若不属于已访问节点集，则执行步骤10；若属于已访问节点集，则返回执行步骤7；步骤10：局部扩展所述群体种子直到该种子所代表的群体的加权导率最小，此时获得一个定向局部群体，群体的加权导率定义为该群体的加权割与该群体的加权体积之比；步骤11：将定向局部群体加入所述权值向量下的定向局部群体集，更新已访问节点集；步骤12：去除所述权值向量下定向局部群体集中...

【技术特征摘要】
1.一种定向局部群体发现方法，其特征在于，包括如下步骤：
步骤1：建立待分析网络的邻接矩阵A和属性矩阵B；
步骤2：用户提供一个反应定向目标的模范节点vp，本发明基于该节点推断其结构邻域
内的属性重要性权值向量集；
步骤3：判断权值向量集是否为空，若权值向量集非空，则进行步骤4；若权值向量集为
空，则执行步骤13；
步骤4：从权值向量集中取出一个权值向量步骤5：基于所述权值向量重新加权获得网络边综合权值；
步骤6：在重新加权网络上提取权值显著大的边，并以所述边构建群体种子集；
步骤7：判断群体种子集是否为空，若群体种子集非空，则执行步骤8；若群体种子集为
空，则执行步骤12；
步骤8：从群体种子集中取出一个群体种子；
步骤9：判断所述群体种子是否属于已访问节点集，若不属于已访问节点集，则执行步
骤10；若属于已访问节点集，则返回执行步骤7；
步骤10：局部扩展所述群体种子直到该种子所代表的群体的加权导率最小，此时获得
一个定向局部群体，群体的加权导率定义为该群体的加权割与该群体的加权体积之比；
步骤11：将定向局部群体加入所述权值向量下的定向局部群体集，更新已访问节点
集；
步骤12：去除所述权值向量下定向局部群体集中不重要的和重复的定向局部群体，不
重要的群体是那些内部边权值之和与网络所有边权值之和之比小于一个显著性门限的群
体，重复的群体是那些和已存在群体集中的群体之间交集的规模大于一个重复门限的群
体；
步骤13：输出所有定向局部群体集。
2.根据权利要求1所述的定向局部群体发现方法，其特征在于，所述步骤1中的邻接矩
阵A编码网络结构信息，矩阵内的任一元素Aij代表边(vi,vj)的拓扑权值，当值为0时，表示
对应节点对之间不存在边，属性矩阵B编码网络属性信息，属性矩阵B内的任...

【专利技术属性】
技术研发人员：潘理，吴鹏，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人