【技术实现步骤摘要】
基于属性连边的多粒度属性网络嵌入的节点分类方法及系统
[0001]本专利技术涉及网络嵌入
,具体来说是一种基于属性连边的多粒度属性网络嵌入的节点分类方法及系统。
技术介绍
[0002]网络数据形式可以自然地表达物体和物体间的联系,在我们的日常生活与工作中无处不在。近年来,网络作为一种模拟现实世界中复杂系统的重要数据结构发展迅猛,如引文网络、社交网络等都能通过构建复杂网络模型来进行一系列数据挖掘分析。作为组成网络的基本部分,节点和边是至关重要的。例如在引文网络中,每一篇文章都可以用一个节点进行表示,而文章与文章之间的引用关系则用网络中的连边进行描述,通过对文章的标签进行预测,能够将具有较高相似度的引文推荐给读者。而在社交网络中,每一个社交实体用户都可以用一个节点进行表示,而用户之间的关系则可以用边进行替代,通过对用户的类型预测分类,构建节点分类模型,实现用户的个性化推荐。因此,节点分类的问题研究在网络分析中具有至关重要的作用。
[0003]网络嵌入是通过保持网络结构及其固有特征,将每个节点映射成低维向量表示,随着 ...
【技术保护点】
【技术特征摘要】
1.基于属性连边的多粒度属性网络嵌入的节点分类方法,其特征在于,包括以下步骤:S1、根据输入网络对网络中节点进行编号并获取节点的标签信息,然后构建结构网络G
topo
;S2、捕获所有节点属性信息,首先聚类初步筛选出属性相似的节点,然后在各聚类中与阈值进行比较筛选出网络全局中属性高相似的节点对,最后利用提出的属性连边方法构建属性网络G
feat
;S3、针对输入网络,调整网络结构及属性的权重,融合结构网络和属性网络构成融合网络S4、根据网络中的拓扑结构和节点的属性信息进行划分得到网络重复划分过程,得到一系列网络规模逐渐缩小的属性网络:分别代表网络中的不同粒度,其中i、k为整数,i为0
‑
k之间的整数;S5、矩阵分解获取各粒度属性网络的初始节点低维向量表示,通过频谱传播优化初始表示,得到该粒度的节点特征表示;S6、拼接各个粒度的节点特征表示,得到反映网络多个粒度的节点特征表示;S7、将多粒度属性网络的节点特征表示和标签送入到分类器中,预测未知类别的节点的标签,标签相同的节点分为同一类,完成节点分类。2.根据权利要求1所述的基于属性连边的多粒度属性网络嵌入的节点分类方法,其特征在于,所述步骤S1包括:S11、处理输入网络,包括:步骤A、将网络中的实体进行编号;且所述网络包括n1个实体,每个实体作为网络的节点,n1个实体之间的关系作为网络的连边,连边数量为n2;步骤B、将输入网络中的实体分为若干类别,且每个节点的标签为类别的编号;S12、根据处理后网络的数据,构建结构网络G
topo
:网络G
topo
=(V,E),其中,V表示n1个节点的集合,E表示n2条连边的集合。S13、根据处理后网络的数据,构建结构网络G
topo
:网络G
topo
=(V,E),其中,V表示n1个节点的集合,E表示n2条连边的集合。3.根据权利要求2所述的基于属性连边的多粒度属性网络嵌入的节点分类方法,其特征在于,所述属性连边步骤S2包括:S21、筛选属性高相似的节点对进行属性连边:获取节点属性信息,利用KMeans算法对网络中节点基于属性关系进行聚类;对于各个类中的节点,同时将每两个节点之间进行余弦相似度AttiSim检测;利用公式(1)对节点对进行相似度检测并赋值,A
f
(i,j)代表中第i个节点与第j个节点之间的相似程度,以矩阵形式表示:若节点对之间的属性相似度AttiSim大于预设阈值γ,则将该对节点筛选出作为属性高相似的节点对;
通过对比阈值获得节点之间的属性相似度AttiSim高的节点对,即节点之间的属性具有高度相似性。将这两个节点之间新连一条边,权值设置为节点对上的余弦相似度值,代表两个节点之间的属性相似程度,该过程即为属性连边;S22、根据属性连边得到的结果,构建属性网络G
feat
:网络G
feat
=(V,E,X),其中,V表示n1个节点的集合,E表示n2个连边的集合,X为一个n1·
l的多维矩阵,l代表节点属性的维度;根据已有节点和新生成的连边情况构建完成属性网络G
feat
。4.根据权利要求3所述的基于属性连边的多粒度属性网络嵌入的节点分类方法,其特征在于,所述步骤S3包括:S31、针对给定输入网络,调整网络结构及属性加入权重,融合结构网络和属性网络构成融合网络将结构网络G
topo
及属性网络G
feat
分别以邻接矩阵A
topo
,A
feat
表示,针对不同网络,如公式(2)所示各自赋...
【专利技术属性】
技术研发人员:赵姝,姚诚,杜紫维,段震,陈洁,张燕平,
申请(专利权)人:安徽大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。