一种基于非线性非负矩阵分解的社区发现方法技术

技术编号:31787606 阅读:53 留言:0更新日期:2022-01-08 10:44
本发明专利技术涉及一种基于非线性非负矩阵分解的社区发现方法,包括以下步骤:S1:进行社交网络的形式化,生成无向图;S2:根根据无向图,引入图卷积网络GCN与NMF模型构建统一损失函数;S3:优化统一损失函数得到局部最优解;S4:根据局部最优解提取社区发现结果。引入图卷积网络GCN与NMF模型构建统一的损失函数,并进行联合训练赋予NMF非线性特征的学习能力,从而实现提高基于NMF社区发现方法性能。提高基于NMF社区发现方法性能。提高基于NMF社区发现方法性能。

【技术实现步骤摘要】
一种基于非线性非负矩阵分解的社区发现方法


[0001]本专利技术涉及卷积网络领域,更具体地,涉及一种基于非线性非负矩阵分解的社区发现方法。

技术介绍

[0002]广大互联网用户普遍使用的社交网络(如微信、QQ以及微博)存在社区结构,相同社区的用户彼此连接更加紧密,而不同社区的用户彼此连接稀疏。对社交网络进行社区发现,不仅可以理解网络结构特征,而且可以挖掘相似用户群体,对于进行用户产品和服务的精准推荐具有重要应用价值。
[0003]目前已有不同类别的社区发现方法提出,其中基于非负矩阵分解 (Nonnegative matrix factorization,NMF)的社区发现方法使用越来越广泛,其原因在于它们具有结果易解释、通用性强以及可融合多源信息发现高质量社区等特性。然而,NMF本质上是一个线性模型,表达能力较弱,难于学习在线社交网络中隐含的多层次复杂特征,在提高社区发现性能方面具有一定的局限性。为此,现有基于NMF的社区发现方法仍然有进一步改进的空间,如果能令其具有非线性特征的学习能力,可以有利于获得更好的社区发现性能。
[0004]中国专利技术专利CN111400652A公开了“一种非负矩阵社区发现方法及电影社区发现方法”,公开日为2020年07月10日:包括如下步骤S11数据收集与计算,形成相似度矩阵X和L;S12将X进行非负矩阵分解,X≈UV;S13构造含有L 的目标函数O;以及S14基于目标函数,得到非负矩阵分解的迭代公式,进行迭代,完成社区划分,该专利技术将双属性的非负矩阵分解应用于社区发现,提高了社区分解模块的精确性,但是不具有线性特征的学习能力,无法提升社区发现性能。

技术实现思路

[0005]本专利技术为解决现有的基于NMF的社区发现方法一个线性模型,表达能力较弱的技术缺陷,提供了一种基于非线性非负矩阵分解的社区发现方法。
[0006]为实现以上专利技术目的,采用的技术方案是:
[0007]一种基于非线性非负矩阵分解的社区发现方法,包括以下步骤:
[0008]S1:进行社交网络的形式化,生成无向图;
[0009]S2:根根据无向图,引入图卷积网络GCN与NMF模型构建统一损失函数;
[0010]S3:优化统一损失函数得到局部最优解;
[0011]S4:根据局部最优解提取社区发现结果。
[0012]上述方案中,引入图卷积网络GCN与NMF模型构建统一的损失函数,并进行联合训练赋予NMF非线性特征的学习能力,从而实现提高基于NMF社区发现方法性能。
[0013]优选的,在步骤S1中,所述无向图为G=(V,E),其中V={v1,...,v
n
}为n个网络用户节点的集合,E={e
ij
|v
i
∈V∧v
j
∈V}表示为用户节点之间连接边的集合。
[0014]优选的,使用一个n
×
n的对称邻接矩阵A=[A
ij
]n
×
n
表示用户节点之间的连接边信
息,如果e
ij
∈E,则A
ij
=A
ji
=1,否则A
ij
=A
ji
=0。
[0015]优选的,采用一个n
×
n的单位矩阵I作为节点特征输入矩阵X,对矩阵X 采用ReLU非线性激活函数和softmax函数归一化输出节点特征矩阵Z=[Z
ij
]n
×
d
, d为特征维度,图卷积网络GCN的输出结果表示如下:
[0016]Z=softmax(PReLU(PXW0)W1)
ꢀꢀ
(1)
[0017]其中为矩阵A+I的度矩阵,W0和W1均为各层学习的参数矩阵;获得Z之后,通过函数sigmoid获得节点对之间的相似性矩阵
[0018][0019]可以视为G的重建结构特征矩阵,与A之间的欧几里得距离定义为 GCN的损失函数L
GCN

[0020][0021]此外为非负值矩阵且是对称矩阵,基于对称NMF模型获得节点的社区归属关系指示矩阵H=[H
ij
]n
×
k
,k为预先指定的社区数量,其对应的损失函数为:
[0022][0023]其中H具有非负值约束,结合GCN和NMF的损失函数,可以构建两者的统一损失函数L为:
[0024][0025]其中α为权衡参数。
[0026]优选的,图卷积网络GCN采用三层结构,包含输入层、隐藏层以及输出层;输入层采用一个n
×
n的单位矩阵I作为节点特征输入矩阵X,输入层到隐藏层采用ReLU非线性激活函数,隐藏层到输出层采用softmax函数归一化输出节点特征矩阵Z=[Z
ij
]n
×
d
,d为特征维度
[0027]优选的,图卷积网络GCN的目的是用来提取拓扑图的空间特征,主要有两类,分别为基于空间域或顶点域的图卷积网络和基于频域或谱域的图卷积网络。
[0028]优选的,在步骤S3中,通过优化最小化统一损失函数L获得社区归属关系指示矩阵H的局部最优解。
[0029]优选的,首先固定GCN的损失函数,在社区归属关系指示矩阵H具有非负值约束条件下,结合拉格朗日乘数法和Karush

Kuhn

Tucker优化条件推导获得社区归属关系指示矩阵H的迭代更新规则为:
[0030][0031]然后将式(6)代入式(5)获得对GCN进行训练的损失函数,采用梯度下降优化方法对GCN进行训练;最后通过设置迭代次数t,重复执行式(6)和训练GCN获得社区归属关系指示矩阵H的局部最优解。
[0032]优选的,在步骤S4中,待发现的k个社区为C={c1,...,c
k
},根据社区归属关系指示矩阵H获取社区划分结果。
[0033]优选的,步骤S4的具体过程为:对于任意一个用户节点v
i
,其中h
il
表示节点i与社区l的归属强度,表示将节点i具有最大归属强度的社区编号赋值给q,即有c
q
=c
q
∪{v
i
};按照以上规则,通过依次扫描社区归属关系指示矩阵H的行向量获得最终的社区划分结果。
[0034]与现有技术相比,本专利技术的有益效果是:
[0035]本专利技术提供一种基于非线性非负矩阵分解的社区发现方法,引入图卷积网络 GCN与NMF模型构建统一的损失函数,并进行联合训练赋予NMF非线性特征的学习能力,从而实现提高基于NMF社区发现方法性能,表达能力强。
附图说明
[0036]图1为本专利技术的方法流程示意图;
[0037]图2为本专利技术的结构框架示意图;图3为本专利技术的社区网络示意图;图4为本专利技术的社区划分结果图。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于非线性非负矩阵分解的社区发现方法,其特征在于,包括以下步骤:S1:进行社交网络的形式化,生成无向图;S2:根据无向图,引入图卷积网络GCN与NMF模型构建统一损失函数;S3:优化统一损失函数得到局部最优解;S4:根据局部最优解提取社区发现结果。2.根据权利要求1所述的一种基于非线性非负矩阵分解的社区发现方法,其特征在于,在步骤S1中,所述无向图为G=(V,E),其中V={v1,...,v
n
}为n个网络用户节点的集合,E={e
ij
|v
i
∈V∧v
j
∈V}表示为用户节点之间连接边的集合。3.根据权利要求2所述的一种基于非线性非负矩阵分解的社区发现方法,其特征在于,使用一个n
×
n的对称邻接矩阵A=[A
ij
]
n
×
n
表示用户节点之间的连接边信息,如果e
ij
∈E,则A
ij
=A
ji
=1,否则A
ij
=A
ji
=0。4.根据权利要求3所述的一种基于非线性非负矩阵分解的社区发现方法,其特征在于,采用一个n
×
n的单位矩阵I作为节点特征输入矩阵X,对矩阵X采用ReLU非线性激活函数和softmax函数归一化输出节点特征矩阵Z=[Z
ij
]
n
×
d
,d为特征维度,图卷积网络GCN的输出结果表示如下:Z=softmax(PReLU(PXW0)W1)(1)其中其中为矩阵A+I的度矩阵,W0和W1均为各层学习的参数矩阵;获得Z之后,通过函数sigmoid获得节点对之间的相似性矩阵得Z之后,通过函数sigmoid获得节点对之间的相似性矩阵得Z之后,通过函数sigmoid获得节点对之间的相似性矩阵可以视为G的重建结构特征矩阵,与A之间的欧几里得距离定义为GCN的损失函数L
GCN
:此外为非负值矩阵且是对称矩阵,基于对称NMF模型获得节点的社区归属关系指示矩阵H=[H
ij
]
n
×
k
,k为预先指定的社区数量,其对应的损失函数为:其中H...

【专利技术属性】
技术研发人员:贺超波呼增付志文郑裕龙
申请(专利权)人:仲恺农业工程学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1