一种基于跨双层网络随机游走的网络表征方法技术

技术编号:21095653 阅读:29 留言:0更新日期:2019-05-11 12:18
本发明专利技术涉及网络表征技术领域,具体涉及一种基于跨双层网络随机游走的网络表征方法,包括以下步骤:A)建立网络拓扑结构;B)获得角色相似度矩阵;C)建立双层混合网络;D)获得随机游走序列;E)使用连续词袋模型获得网络的表征。角色相似度矩阵S的建立方法为:B1)列举所有大小小于或等于给定大小k的所有子图;B2)枚举非同构轨道,数量记为m;B3)将每个节点参与m个角色的情况使用长度为m的向量表示;B4)将每两个节点的角色表征向量的相似度作为该两个节点的相似度,角色相似度矩阵S。本发明专利技术的有益效果是:利用随机游走和连续词袋模型,不但实现同时融合网络邻接性和结构相似性的表征,还可以实现对非连通但角色相似的网络节点的有效表征。

A Network Representation Method Based on Random Walk across Two-tier Networks

【技术实现步骤摘要】
一种基于跨双层网络随机游走的网络表征方法
本专利技术涉及网络表征
,具体涉及一种基于跨双层网络随机游走的网络表征方法。
技术介绍
在大数据时代,不但数据规模随时间呈爆发式增长、数据的形式多样化,而且数据间呈现出复杂的关联关系。分析关联大数据所需的算力与数据供给之间的不平衡,使得关联大数据的处理面临着严峻的挑战。“网络”因其强大且灵活的表征能力,成为了关联数据最自然和直接的表达方式。由于网络的高维度特性,当网络规模较大的时候,传统的基于网络拓扑的表征方式通常不可避免地存在运算复杂度高、无法有效进行并行化运算,从而导致运行时间过长等问题。因此,如何将高维稀疏网络以低维向量形式表征,成为了一个至关重要的问题和挑战。网络嵌入旨在将网络中的节点表示成低维、实值、稠密的向量形式。目前常见的网络表征学习方法主要分为三种:基于矩阵分解的方法、基于随机游走的方法、基于深度神经网络的方法。但是通过对现有的方法进行研究之后,我们发现目前大多数网络嵌入方法主要关注保持网络的拓扑结构特性:即如果网络中两个节点的最短距离较近,则它们在表征后的低维空间中的距离也接近;反之亦然。大多数网络表征学习算法要求网络本文档来自技高网...

【技术保护点】
1.一种基于跨双层网络随机游走的网络表征方法,其特征在于,包括以下步骤:A)根据真实系统中实体之间的关系建立网络拓扑结构,获得网络邻接矩阵W={wij},i,j∈[1,n],n为网络拓扑结构节点数量;B)获得节点在大小不超过给定值k的诱导子图中的角色序列,记为表征向量,建立节点之间的角色相似度矩阵S={sij},i,j∈[1,n];C)根据网络邻居矩阵W以及角色相似度矩阵中节点的一一对应关系,建立双层混合网络;D)依次从每个节点开始,进行h次跨双层混合网络的随机游走,从随机游走序列中得到截断长度为l的共h组节点序列,n个节点共获得n*h个长度为发的节点序列;E)使用连续词袋模型或跳字模型获得每...

【技术特征摘要】
1.一种基于跨双层网络随机游走的网络表征方法,其特征在于,包括以下步骤:A)根据真实系统中实体之间的关系建立网络拓扑结构,获得网络邻接矩阵W={wij},i,j∈[1,n],n为网络拓扑结构节点数量;B)获得节点在大小不超过给定值k的诱导子图中的角色序列,记为表征向量,建立节点之间的角色相似度矩阵S={sij},i,j∈[1,n];C)根据网络邻居矩阵W以及角色相似度矩阵中节点的一一对应关系,建立双层混合网络;D)依次从每个节点开始,进行h次跨双层混合网络的随机游走,从随机游走序列中得到截断长度为l的共h组节点序列,n个节点共获得n*h个长度为发的节点序列;E)使用连续词袋模型或跳字模型获得每个节点的向量表示,从而获得网络的表征;所述使用连续词袋模型获得节点的向量表示的方法为:把网络中的节点作为词,把通过随机游走得到的节点序列作为语句,使用word2vec的连续词袋模型,将每个词表示成一个定长的向量,将本步骤获得的定长向量作为对应节点的表征,从而获得网络的表征。2.根据权利要求1所述的一种基于跨双层网络随机游走的网络表征方法,其特征在于,角色相似度矩阵S的建立方法为:B1)列举所有大小小于或等于给定大小k的所有子图;B2)枚举所有子图中的非同构轨道,标记非同构轨道中的角色,全部非同构轨道中包含的角色数量记为m;B3)将每个节点参与所述m个角色的情况使用长度为m的向量表示,该向量作为该节点的角色表征向量;B4)将每两个节点的角色表征向量的相似度作为该两个节点的相似度,角色相似度矩阵S。3.根据权利要求1或2所述的一种基于跨双层网络随机游走的网络表征方法,其特征在于,节点之间的角色相似度矩阵S的元素其中,GDV(i)、GDV(j)分别为节点i、j的角色表征向量,i,j∈[1,n]。4.根据权利要求1或2所述的一种基于跨双层网络随机游走的网络表征方法,其特征在于,步骤B中使用角色表征向量建立节点之间的角色相似度矩阵S前,对角色表征向量进行中心化和标准化处理,所述中心化的方法为:将角色表征向量中的每个元素减去该向量中全部元素的均值;所述标准化的方法为:计算中心化后角色表征向量全部元素的标准差,将角色表征向量中的每个元素除以标准差。5.根据权利要求1或2所述的一种基于跨双层...

【专利技术属性】
技术研发人员:史本云钟佳楠邱洪君韩腾海张新波
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1