基于边的随机游走的网络表示学习方法和装置制造方法及图纸

技术编号:21399137 阅读:28 留言:0更新日期:2019-06-19 07:02
本发明专利技术公开了一种基于边的随机游走的网络表示学习方法和装置,所述方法包括:根据网络的每个节点的主题向量和边的关联时间戳,计算所述网络中边与边的相似度;根据计算的边与边的相似度计算边到边的转移概率;基于所述元路径的指导,根据计算的转移概率进行随机游走生成节点序列;根据得到的节点序列进行节点的表示学习,得到节点的低维表示。本发明专利技术能够诠释出语义信息和时间信息以获得更为丰富的网络内容,从而有助于能够更真实且有效地挖掘现实世界的潜在信息;且能针对随着时间推移而发生变化的网络进行更为适当、贴合实际的表示。

【技术实现步骤摘要】
基于边的随机游走的网络表示学习方法和装置
本专利技术涉及网络表示学习
,特别是指一种基于边的随机游走的网络表示学习方法和装置。
技术介绍
现实生活中的很多应用都可以抽象为网络,而网络能够用图进行表示,因此大多数研究利用一些研究图的方法来帮助分析网络,从而解决各种实际场景的需求和问题。图是一种重要的数据表示,并广泛应用于计算机科学和生物等相关领域。社交网络、公路网、学术网络、生物蛋白质网络以及通信网络等现实生活中的实际应用都可以建模为图。通过将实体之间的交互行为建模为图形,研究人员能够以系统的方式理解各种网络。有效的图分析可以让用户对数据背后的内容有更深入的了解,因此可以从节点分类、节点推荐、链接预测等许多有用的应用中获益。大量的机器学习方法试图通过以图结构数据作为特征信息来挖掘或预测网络潜在的模式。而基于图的机器学习的一个关键问题是找到一种方法,将图的信息融入到机器学习模型中。在信息网络的快速发展下,研究者致力于设计各种快速有效的算法来满足网络发展带来的更高需求。在这方面的研究中,首先会面临的一个重要问题就是怎样有效地对网络进行表示。虽然基于图的网络表示方法已经存在,但大多数方法都有较高的计算和空间成本。为了从网络中提取重要的信息,传统基于图的表示方法通常依赖于原始图的邻接矩阵、邻接表或精心设计的特征。然而,由于这些人工设计的特征不灵活,这些方法对深入分析网络是有限的,并且设计这些特征可能是一个耗时且昂贵的过程。针对这个问题,最近大量的研究专注于学习网络的低维向量表示。即学习到一个映射,可以将图中的节点或者子图甚至整个图作为低维向量空间的点来表示,从而最大化地保留原始网络的结构或者信息。学习到的低维向量空间可以直接作为下游机器学习任务,如分类、聚类等的网络特征输入。早期的网络表示学习主要针对静态的同构网络,能够实现对网络拓扑结构的有效表示,但是缺乏细致的语义信息;而且,现如今网络数据量日益增长,网络的规模和形态随时间的推移发生着显著的变化,主要针对静态的同构网络的现有的网络表示学习也缺乏时间信息,不能针对网络由于时间推移而发生的变化而对网络表示进行适当的调整;因此,现有技术的网络表示学习方法无法对网络蕴含的丰富内容进行诠释,不能针对随着时间推移而发生变化的网络进行更为适当、贴合实际的表示。鉴于网络表示学习对于网络分析的重要性,对现实世界的强大表现能力,因此,本专利技术有必要提供一种基于边的随机游走的网络表示学习方法和装置,能够诠释出语义信息和时间信息以获得更为丰富的网络内容,从而有助于能够更真实且有效地挖掘现实世界的潜在信息;且能针对随着时间推移而发生变化的网络进行更为适当、贴合实际的表示。
技术实现思路
本专利技术提出了一种基于边的随机游走的网络表示学习方法和装置,能够诠释出语义信息和时间信息以获得更为丰富的网络内容,从而有助于能够更真实且有效地挖掘现实世界的潜在信息;且能针对随着时间推移而发生变化的网络进行更为适当、贴合实际的表示。基于上述目的,本专利技术提供一种基于边的随机游走的网络表示学习方法,包括:根据网络的每个节点的主题向量和边的关联时间戳,计算所述网络中边与边的相似度;根据计算的边与边的相似度计算边到边的转移概率;基于所述元路径的指导,根据计算的转移概率进行随机游走生成节点序列;根据得到的节点序列进行节点的表示学习,得到节点的低维表示。其中,所述根据网络的每个节点的主题向量和边的关联时间戳,计算所述网络中边与边的相似度,具体包括:根据网络的每个节点的主题向量和边的关联时间戳,计算所述网络中节点间的相似度;根据计算的节点间的相似度计算所述边与边的相似度。其中,所述计算所述网络中节点间的相似度,具体为:根据如下公式一计算节点间的相似度:公式一中,a表示所述网络中所有与节点am相连的中心类型节点,a′表示所述网络中所有与节点an相连的中心类型节点,tc表示当前时间戳,Topic(a)表示中心类型节点a的主题向量,Topic(a′)表示中心类型节点a′的主题向量,η是时间衰减因子(η=0.62)。ta表示节点a与am构成的边的关联时间戳,ta′表示节点a′与an构成的边的关联时间戳;type(a)=Cnode表示节点a的类型为中心类型节点;type(a′)=Cnode表示节点a′的类型为中心类型节点;(a,am)∈E表示a与am构成的边是所述网络中真实存在的一条边,(a′,an)∈E表示a′与an构成的边是所述网络中真实存在的一条边。其中,所述根据计算的节点间的相似度计算所述边与边的相似度,具体为:根据如下公式五计算边与边的相似度:s(ri,ri-1)=s(ai-1,ai+1)+s(ai,ai+1)+s(ai-1,ai)(公式五)公式五中,ri-1表示节点ai-1与节点ai构成的边;ri表示节点ai与节点ai+1构成的边;s(ai-1,ai+1)表示节点ai-1与节点ai+1的相似度;s(ai,ai+1)表示节点ai与节点ai+1的相似度;s(ai-1,ai)表示节点ai-1与节点ai的相似度;s(ri,ri-1)表示边ri-1与边ri的相似度。其中,所述根据计算的边与边的相似度计算边到边的转移概率,具体包括:根据如下公式六计算边到边的转移概率:公式六中,p(ri|ri-1)表示边ri-1到边ri的转移概率,s(ri,ri-1)表示边ri和边ri-1的相似度,E(ri-1)表示与边ri-1存在枢纽节点的下一跳邻居边集合,e是E(ri-1)集合中的一个元素,而e∈E(ri-1);s(ri-1,e)表示边e和边ri-1的相似度;α用来衡量两跳内所有节点间的相似度对该转移概率的重要性,为设定的第一权值;β用来衡量网络的拓扑结构对该转移概率的重要性,为设定的第二权值。较佳地,在所述基于所述元路径的指导,根据计算的边到边的转移概率进行随机游走之前,还包括:确定基于该元路径的随机游走的采样次数:将本次随机游走的源边的关联时间戳与当前时间戳进行比较;若两者差值小于设定的时间阈值,则设置所述采样次数为λ;否则,设置所述采样次数为其中,以及所述基于所述元路径的指导,根据计算的边到边的转移概率进行随机游走,具体为:基于所述元路径的指导,根据计算的边到边的转移概率和确定的采样次数进行随机游走。较佳地,所述基于所述元路径的指导,根据计算的边到边的转移概率进行随机游走,具体包括:对于每次随机游走,若根据边到边的转移概率随机游走到的当前边的关联时间戳与此次随机游走的源边的关联时间戳的差值大于停止阈值γ时,结束此次随机游走。较佳地,所述网络的元路径具体根据如下方法确定:根据指定的源节点的类型、目标节点的类型,生成所述网络的原始元路径;对所述原始元路径中的对称元路径,进行至少一次正向游走,直到所得元路径的长度达到或者超过最大长度值maxLength时,将所得元路径作为最终延长得到的元路径;对所述原始元路径中首尾节点类型相同的非对称元路径,先进行一次逆向游走,得到对称元路径;将得到的对称元路径进行至少一次正向游走,直到所得元路径的长度达到或者超过最大长度值maxLength时,将所得元路径作为最终延长得到的元路径;对所述原始元路径中首尾节点类型不同的非对称元路径,先进行一次逆向游走,得到首尾节点类型相同的非对称元路径;将得到的首本文档来自技高网
...

【技术保护点】
1.一种基于边的随机游走的网络表示学习方法,其特征在于,包括:根据网络的每个节点的主题向量和边的关联时间戳,计算所述网络中边与边的相似度;根据计算的边与边的相似度计算边到边的转移概率;基于所述元路径的指导,根据计算的转移概率进行随机游走生成节点序列;根据得到的节点序列进行节点的表示学习,得到节点的低维表示。

【技术特征摘要】
1.一种基于边的随机游走的网络表示学习方法,其特征在于,包括:根据网络的每个节点的主题向量和边的关联时间戳,计算所述网络中边与边的相似度;根据计算的边与边的相似度计算边到边的转移概率;基于所述元路径的指导,根据计算的转移概率进行随机游走生成节点序列;根据得到的节点序列进行节点的表示学习,得到节点的低维表示。2.根据权利要求1所述的方法,其特征在于,所述根据网络的每个节点的主题向量和边的关联时间戳,计算所述网络中边与边的相似度,具体包括:根据网络的每个节点的主题向量和边的关联时间戳,计算所述网络中节点间的相似度;根据计算的节点间的相似度计算所述边与边的相似度。3.根据权利要求2所述的方法,其特征在于,所述计算所述网络中节点间的相似度,具体为:根据如下公式一计算节点间的相似度:公式一中,a表示所述网络中所有与节点am相连的中心类型节点,a'表示所述网络中所有与节点an相连的中心类型节点,tc表示当前时间戳,Topic(a)表示中心类型节点a的主题向量,Topic(a′)表示中心类型节点a'的主题向量,η是时间衰减因子(η=0.62)。ta表示节点a与am构成的边的关联时间戳,ta'表示节点a'与an构成的边的关联时间戳;type(a)=Cnode表示节点a的类型为中心类型节点;type(a′)=Cnode表示节点a'的类型为中心类型节点;(a,am)∈E表示a与am构成的边是所述网络中真实存在的一条边,(a′,an)∈E表示a'与an构成的边是所述网络中真实存在的一条边。4.根据权利要求3所述的方法,其特征在于,所述根据计算的节点间的相似度计算所述边与边的相似度,具体为:根据如下公式五计算边与边的相似度:s(ri,ri-1)=s(ai-1,ai+1)+s(ai,ai+1)+s(ai-1,ai)(公式五)公式五中,ri-1表示节点ai-1与节点ai构成的边;ri表示节点ai与节点ai+1构成的边;s(ai-1,ai+1)表示节点ai-1与节点ai+1的相似度;s(ai,ai+1)表示节点ai与节点ai+1的相似度;s(ai-1,ai)表示节点ai-1与节点ai的相似度;s(ri,ri-1)表示边ri-1与边ri的相似度。5.根据权利要求4所述的方法,其特征在于,所述根据计算的边与边的相似度计算边到边的转移概率,具体包括:根据如下公式六计算边到边的转移概率:公式六中,p(ri|ri-1)表示边ri-1到边ri的转移概率,s(ri,ri-1)表示边ri和边ri-1的相似度,E(ri-1)表示与边ri-1存在枢纽节点的下一跳邻居边集合,e是E(ri-1)集合中的一个元素,而e∈E(ri-1);s(ri-1,e)表示边e和边ri-1的相似度;α用来衡量两跳内...

【专利技术属性】
技术研发人员:卢美莲叶丹娜
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1