一种基于潜在结构和属性的非负矩阵分解社区检测方法技术

技术编号:37261227 阅读:12 留言:0更新日期:2023-04-20 23:35
本发明专利技术提供一种基于潜在结构和属性的非负矩阵分解社区检测方法,涉及社区网络检测领域。主要解决现有方法对社区网络信息利用不够充分的问题。该方法包括:先对社区网络数据进行预处理,将网络中的信息进行表示;计算邻接矩阵、属性矩阵和潜在结构矩阵;建立以直系拓扑结构和属性信息为主、潜在结构信息为辅的社区检测模型;计算迭代更新规则;设置迭代次数,初始化社区成员矩阵、两个社区

【技术实现步骤摘要】
一种基于潜在结构和属性的非负矩阵分解社区检测方法


[0001]本专利技术涉及社区网络检测领域,尤其涉及一种结合拓扑结构信息、属性信息以及潜在结构信息的非负矩阵分解社区检测方法。
技术背景
[0002]随着科学技术的迅速发展,网络检测受到许多研究人员的关注并且将其作为一个重要课题,其中一个重要原因是网络检测能更好地帮助理解各种类型的网络,挖掘出网络中隐藏的重要信息;这里所谓的网络指的是自然界和社会中高度互联的实体组成的各种各样的系统,包括神经网络、交通网络、社交网络及其蛋白质相互作用网络等。网络往往有一个共同的特征,即同一组节点之间关联紧密,不同组的节点之间关联稀疏,这种一组一组的节点集合定义为社区;分析这些社区对理解网络的深层特性及功能有着重要意义,例如,它可以用于挖掘政治社交网络的联盟和敌对团体;在合著网络中找到研究团队;在生物信息领域,通过划分生物分子来发现相同结构和功能的生物分子、寻找蛋白质相互作用网络(PPI)中蛋白质复合物;在在线社交网络中找到类似用户群体以及能为舆情分析、城市规划、互联网发展和危害防护等提供重要的参考信息。
[0003]目前最广泛采用的方法有模块化、最小割和非负矩阵分解(Non

negative Matrix Factorization,NMF);其中模块化的提出极大地扩展了社区检测的研究,模块化的目的就是通过确保一个组中的边数明显大于预期的边数,将网络划分为不相交的集合;而最小割是将网络划分为不相交的子图,从而使这些子图之间的割数最小化。
[0004]非负矩阵分解算法(NMF)被广泛应用到人工智能各个领域,NMF可以有效处理大规模数据,获得具有实际意义的矩阵,与其他方法相比,非负矩阵分解的方法有如下优点:1)具有更好的解释性:对一个网络进行具有非负约束的矩阵分解后,会得到一个社区成员矩阵,该矩阵中的每一个元素都可以理解为该节点属于对应社区的概率或强度,这就使得社区检测的结果具有更好的解释性。2)可融入节点相关信息:将节点相关信息(例如节点属性信息等)融入到目标函数中,共同指导目标函数迭代优化,以提升聚类效果。因此,非负矩阵分解成为社区检测的重要方法;近几年对非负矩阵分解在社区检测上的研究也逐渐增加,同时产生多种非负矩阵分解变体,其主要原理是从社区网络中提取出特征矩阵,通过因子分解后获得社区特征矩阵和社区成员矩阵,最后通过对社区成员矩阵进行处理获得社区。
[0005]虽然目前也有许多应用于社区网络检测的非负矩阵分解方法,但传统的NMF算法只利用网络的拓扑结构,并没有考虑网络节点的相关属性信息,或是仅考虑属性信息而没有考虑拓扑结构信息,又或是考虑到拓扑结构和相关属性信息,但没有考虑社区网络节点的潜在结构信息,例如用户A与B有直接连接关系(如相互认识,且都发表过D类型的推文),B与C有直接连接关系(如相互认识,且都发表过D类型的推文),从拓扑结构只能获取B分别与A和C之间的链接关系,并不能获得A与C之间存在潜在相似的信息。因此,如何从复杂网络数据中获得潜在的网络信息是重要研究方向,如何获得更精确的社区成员矩阵和提高算法效率是目前该领域的研究核心。
[0006]综上所述,现有的社区网络检测方法没有同时考虑到拓扑结构信息与属性信息,且没有考虑到网络节点间的潜在拓扑结构关系。

技术实现思路

[0007]鉴于此,本专利技术将解决上述的不足,提出一种结合非负矩阵分解算法的社区检测方法,具体为一种基于潜在结构和属性的非负矩阵分解社区检测方法。
[0008]实现本专利技术的思路是:首先从社区网络中获得拓扑信息、属性信息和潜在结构信息,调节三类信息的平衡系数,并对相关矩阵进行约束,建立以直系拓扑结构和属性信息为主、潜在结构信息为辐的社区检测模型;通过三类信息相互约束,共同学习进行非负矩阵分解,进一步得到社区成员矩阵、社区

社区矩阵、社区属性矩阵;最后根据社区成员矩阵获得更为精确的社区检测结果。
[0009]为了实现上述目的,本专利技术提供如下技术方案:
[0010]一种基于潜在结构和属性的非负矩阵分解社区检测方法,具体包括如下步骤:
[0011]步骤S1:对社区网络数据进行预处理;
[0012]社区网络原始数据仅是数字,因此需要对原始数据进行预处理,将数据转换为一一对应具有实际含义的向量。
[0013]步骤S2:计算社区网络的邻接矩阵A、属性矩阵T和潜在结构矩阵S;
[0014]根据社区网络数据构建邻接矩阵A
n
×
n
,其中n表示网络节点数,若对于任意节点v
i
与v
j
之间存在链接关系,则A
ij
=A
ji
=1,反之不存在链接关系A
ij
=A
ji
=0,邻接矩阵表示社区网络的直系拓扑结构;
[0015]根据社区网络数据构建属性矩阵T
n
×
t
,其中n表示网络节点数,t表示属性数量,标记属性1到t,若节点v
i
具有属性q(1≤q≤t),则T
iq
=1,反之不具有该属性则T
iq
=0;
[0016]根据邻接矩阵构建社区网络的潜在结构矩阵S
n
×
n
,直接链接的节点固然有一定的关系,但无直接连接的节点并不一定没有任何关系,因此,本专利技术将考虑不相邻节点的关系;
[0017]任意两个节点之间共有邻居越多,其相似度越高,挖掘出来的潜在信息越多,因此,不相邻节点间的权重系数也并不是统一的,所以本专利技术将使用杰卡德(Jaccard)相似性系数计算网络潜在结构信息;
[0018]杰卡德(Jaccard)相似性系数计算方法:节点v
i
和v
j
的表示分别由邻接矩阵A
n
×
n
第i行和第j行组成,计算节点v
i
和v
j
表示中交集元素的个数在节点v
i
和v
j
表示中并集元素个数所占的比例:
[0019][0020]杰卡德系数越高,则这两个节点相似度越高,反之两个节点的差异性越大。
[0021]步骤S3:建立以直系拓扑结构和属性信息为主、潜在结构为辅的社区检测模型;
[0022]以社区网络直系拓扑结构信息(节点与节点直接链接)邻接矩阵A
n
×
n
和属性信息T
n
×
t
(节点存在某个属性)为主,以社区网络潜在结构信息S
n
×
n
(节点与节点不存在直接连接,但存在一定的关系)为辅,并对相关分解矩阵进行约束,以此建立社区检测模型。建立目
标函数标函数
[0023]其中社区成员矩阵Z
n
×
k
表示最终社区发现的矩阵,n表示节点成员数量本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于潜在结构和属性的非负矩阵分解社区检测方法,其特征在于,包括如下步骤:S1、对社区网络数据进行预处理;S2、计算社区网络的邻接矩阵A、属性矩阵T和潜在结构矩阵S;S3、建立以直系拓扑结构和属性信息为主、潜在结构为辅的社区检测模型;S4、计算迭代更新规则;S5、设置迭代次数iter,随机初始化社区成员矩阵Z
n
×
k
、社区

社区矩阵社区

社区矩阵和社区属性矩阵M
k
×
t
,同时调节平衡参数α、β、γ;S6、经过迭代获得社区成员矩阵Z
n
×
k
、社区

社区矩阵社区

社区矩阵和社区属性矩阵M
k
×
t
;S7、根据社区成员矩阵Z获得社区检测结果。2.根据权利要求1所述的一种基于潜在结构和属性的非负矩阵分解社区检测方法,其特征在于:步骤S2中,根据社区网络数据构建邻接矩阵A
n
×
n
,其中n表示网络节点数,若对于任意节点v
i
与v
j
之间存在链接关系,则A
ij
=A
ji
=1,反之不存在链接关系A
ij
=A
ji
=0,邻接矩阵表示社区网络的直系拓扑结构;根据社区网络数据构建属性矩阵T
n
×
t
,其中n表示网络节点数,t表示属性数量,标记属性1到t,若节点v
i
具有属性q(1≤q≤t),则T
iq
=1,反之不具有该属性则T
iq
=0;根据邻接矩阵构建社区网络的潜在结构矩阵S
n
×
n
,基于杰卡德(Jaccard)相似性系数计算获得网络潜在结构信息。3.根据权利要求1所述的一种基于潜在结构和属性的非负矩阵分解社区检测方法,其特征在于:步骤S3中,以社区网络直系拓扑结构信息(节点与节点直接链接)邻接矩阵A
n
×
n
和属性信息T
n
×
t
(节点存在某个属性)为主,以社区网络潜在结构信息S
n
×
n
(节点与节点不存在直接连接,但存在一定的关系)为辅,并对相关分...

【专利技术属性】
技术研发人员:陈自刚肖琪张镇江潘鼎颜逸邵鑫牟覃宇
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1