当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于边内容强化的网络表示方法技术

技术编号:20589199 阅读:19 留言:0更新日期:2019-03-16 07:15
本发明专利技术公开一种基于边内容强化的网络表示方法,主要方法步骤为:首先建模网络拓扑保持原始网络结构,融合节点近似性;其次,建模边内容;最后构建边表示和节点表示之间的联系。本发明专利技术融合边内容进行网络节点表示学习的强化,这种细粒度网络信息的融合,可以有效地改善网络节点表示学习的精度。

【技术实现步骤摘要】
一种基于边内容强化的网络表示方法
本专利技术涉及网络分析应用开发
,特别涉及一种基于边内容强化的网络表示方法。
技术介绍
网络作为一种现实世界广泛存在的数据来源,已经深入到各个行业,例如社交网络,生物网络,电话网络等等。越来越多的应用任务也紧紧围绕网络数据展开,譬如社区检测,节点分类,链接预测,推荐系统等等。这些任务的开展,依赖于精确的网络节点表示——一种刻画网络节点的向量形式。传统的网络节点表示是广泛使用的邻接矩阵,但是邻接矩阵在刻画网络节点时常常遭受稀疏性,且易受噪声和冗余信息干扰,因此在应用过程中往往导致不精确的网络表征。近几年,网络表示学习引起了很多知名学者的关注——它的目的是为了在低维向量空间中学习一个连续的密集的向量用来刻画网络中的每一个节点,这些向量可以在数学形式上反映节点的属性,相似性以及在原始网络上的地理位置等。经过网络表示学习方法,网络中的节点被表示成一个低维度紧密连续的向量,摆脱了稀疏性的限制,它可以直接结合许多现有的机器学习方法应用于多种网络分析任务中。目前的网络表示学习方法,普遍大多数以网络拓扑作为主要学习依据。作为网络最直观的结构信息——网络拓扑信息对于网络表示学习方法十分重要,也是大多数网络表示学习方法要保持的信息。根据原始网络的节点结构特点,网络拓扑信息可以具体划分为一阶近似性,二阶近似性以及高阶近似性。这里,一阶近似性刻画节点的直接联系,若两节点在原始网络上有一条直接边相连,则称为该两点具有一阶近似性;二阶近似性刻画节点的非直接联系,一般刻画的是节点邻域的重叠度,若两个节点的邻域存在重叠节点,则称该两点具有二阶近似性。高阶近似性这里指,若某点经过k步可以达到另一点,则称该两点之间有k-阶近似性,当k>2时,称两点之间有高阶近似性。一般的网络表示方法在设计模型的时候都会以保持网络拓扑信息为首要目的。但是在当今的大数据时代,网络的形式多种多样,信息形式也愈来愈丰富,网络拓扑信息已不再是描述网络的唯一方式,一些非拓扑的网络信息像节点属性内容以及节点标签等在描述网络节点时也起到了至关重要的作用。因此,一些网络表示学习方法开始将非拓扑信息考虑在内,用来辅助拓扑信息,以得到更加精确的网络节点表示。事实上,除了上述提到的节点属性内容和节点标签,边属性内容也是一种非常重要的非拓扑信息,但是目前很多方法都没有将其考虑在内。很多学者片面地把边属性内容当成点属性内容来使用,其实是不正确的。譬如在邮件网络中,邮件内容通常被认为是由哪一个节点发出的,则该邮件内容就被认为是附属在该节点上的。严格地说,邮件内容通常是描述了两个节点关系或者两个节点的属性,它附属在两个节点关系上的,而非关系上某个具体的节点上。一般地,如果两条边内容信息比较相似,那么连接这两条边的节点表示也应该比较相似。而且相比较而言,边内容的分布比节点的分布更加密集,粒度更细,因此如果能够有效地融合边内容强化网络节点表示,理论上应该可以得到较优的结果。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种基于边内容强化的网络表示方法,有效地利用边内容信息强化网络节点表示,弥补现有方法的不足,用来服务于譬如节点分类,聚类等网络分析任务。本专利技术为解决
技术介绍
中的技术问题,采用的技术方案是:一种基于边内容强化的网络表示方法,一种基于边内容强化的网络表示方法,包括以下步骤:步骤1)建模网络拓扑保持原始网络结构,融合节点近似性;步骤2)建模边内容;步骤3)构建边表示和节点表示之间的联系。本专利技术所述步骤1)具体如下:(1)利用矩阵的传递性并结合矩阵乘法的特性,以原始的邻接矩阵A为基作为网络拓扑一阶近似性的刻画;(2)通过邻接矩阵的k次幂刻画k阶近似性,同时考虑到网络拓扑普遍以一阶近似性和二阶近似性为主;取一阶近似性和二阶近似性的平均值作为近似性输入;(3)采用矩阵分解框架,对拓扑矩阵进行分解;(4)建模网络拓扑部分的模型。本专利技术所述步骤2)具体如下:(1)假设边内容矩阵;(2)引入边的表示,根据向量空间基变换,借助于辅助矩阵,将边内容映射成边的表示,进行稀疏约束。本专利技术所述步骤3)具体如下:(1)建立边表示和节点表示的关联关系;(2)引入网络二部图:依据网络表示学习的定义,如果某条边的表示和某个点的表示存在很大的近似性,则大概率这个节点附属于该边上;(3)通过边表示和节点的表示的内积,近似地拟合网络二部图。有益效果与现有技术相比,本专利技术通过对现有技术分析其不足并进行创新,改善了边内容和点内容的概念误区,并提出了一种有效地模型,融合边内容进行网络节点表示学习的强化,这种细粒度网络信息的融合,可以有效地改善网络节点表示学习的精度,产生的有益效果具体如下:1、该模型基于稀疏矩阵乘法设计,由于矩阵中零值的存在,执行效率和运行时间相比其他同规模的方法更快更高;2、本模型采用的边内容在刻画节点关系上效力更高,粒度更细,而且它是一种直接利用边内容来增强网络节点的表示,同比那些把边内容当作点内容来用的方法,学习到的节点表示更加精确。附图说明图1为基于边内容强化的网络表示方法框架;图2为实例模型部署采用的数据集;图3为基于边内容强化的网络表示方法在聚类任务上的表现对比;图4为基于边内容强化的网络表示方法在分类任务上的表现对比。具体实施方式下面结合附图和具体实施例对本专利技术技术方案作进一步详细描述,所描述的具体实施例仅对本专利技术进行解释说明,并不用以限制本专利技术。下面将对本专利技术的模型和部署方式结合附图作进一步的详细描述。步骤1)为建模网络拓扑保持原始网络结构,融合节点近似性。这里我们利用矩阵的传递性并结合矩阵乘法的特性,以原始的邻接矩阵A为基作为网络拓扑一阶近似性的刻画,通过邻接矩阵的k次幂刻画k阶近似性,同时考虑到网络拓扑普遍以一阶近似性和二阶近似性为主,这里我们取一阶近似性和二阶近似性的平均值作为近似性输入即A=(A+A*A)/2。接下来,采用当下流行的矩阵分解框架,对拓扑矩阵进行分解。根据网络表示学习的定义,如果两个节点之间存在近似性,则该两个节点在低维空间的表示向量也存在近似性。因此,设Ui和Uj分别表示节点i和节点j的表示,则可以近似地用UiUjT拟合该两个节点之间近似性。故得建模网络拓扑部分的模型为||A-UUT||。步骤2)为建模边内容。假设边内容矩阵为m为边的个数,p为属性维度。我们这里引入边的表示即根据向量空间基变换,我们借助于辅助矩阵将边内容映射成边的表示即||EQ-B||,考虑到边内容的属性存在很多噪音以及冗余信息,这里我们辅以特征选择手段在Q矩阵上加以2,1范进行稀疏约束,有效地筛选出重要的特征,进一步保证边内容的强化作用。步骤3)为构建边表示和节点表示之间的联系。我们的目的是为了有效地利用边内容强化网络节点表示,为了实现这一目的,必须有效地建立边表示和节点表示的关联关系。引入网络二部图可以顺利地实现这一目标。这里网络二部图是刻画网络中节点和边的关系,则依据网络表示学习的定义,如果某条边的表示和某个点的表示存在很大的近似性,则大概率这个节点附属于该边上,因此通过边表示和节点的表示的内积,可以近似地拟合网络二部图即||UBT-F||。通过该种方式,我们可以有效地建立边表示和节点表示之间的联系。模型部署结合本专利技术提出模型,这里本文档来自技高网
...

【技术保护点】
1.一种基于边内容强化的网络表示方法,其特征在于,包括以下步骤:步骤1)建模网络拓扑保持原始网络结构,融合节点近似性;步骤2)建模边内容;步骤3)构建边表示和节点表示之间的联系。

【技术特征摘要】
1.一种基于边内容强化的网络表示方法,其特征在于,包括以下步骤:步骤1)建模网络拓扑保持原始网络结构,融合节点近似性;步骤2)建模边内容;步骤3)构建边表示和节点表示之间的联系。2.根据权利要求1所述的一种基于边内容强化的网络表示方法,其特征在于,所述步骤1)具体如下:(1)利用矩阵的传递性并结合矩阵乘法的特性,以原始的邻接矩阵A为基作为网络拓扑一阶近似性的刻画;(2)通过邻接矩阵的k次幂刻画k阶近似性,同时考虑到网络拓扑普遍以一阶近似性和二阶近似性为主;取一阶近似性和二阶近似性的平均值作为近似性输入;(3)采用矩阵分解框架,对拓扑矩阵进行分解...

【专利技术属性】
技术研发人员:金弟王二伟
申请(专利权)人:天津大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1