一种节点嵌入表示方法和装置制造方法及图纸

技术编号:20329262 阅读:53 留言:0更新日期:2019-02-13 05:49
本申请提供了一种节点嵌入表示方法和装置,该方法包括:基于图结构中节点之间的连接关系以及转移概率,生成节点序列;基于所述节点序列,为所述节点序列中的选定节点确定关联节点序列;针对所述选定节点,基于所述选定节点的关联节点序列中每个节点的特征向量,确定所述选定节点的表示向量。

【技术实现步骤摘要】
一种节点嵌入表示方法和装置
本申请涉及数据分析
,具体而言,涉及一种节点嵌入表示方法和装置。
技术介绍
图结构是一种直观可见的结构,同时图结构能够充分反映数据之间的真实依赖关系。通过对图结构进行特征学习,实现节点、边的嵌入表示,能够挖掘图结构所体现的数据之间的关系。现有对图结构的特征向量学习方法通过随机游走从图结构中得到节点序列,再通过模型训练,得到节点的表示向量。这种方法忽略了节点序列中节点的先后顺序,例如,没有充分挖掘图结构中节点之间的转移概率信息或拓扑结构,使得现有特征向量学习方法得到的节点的特征向量不能充分反映图结构中所蕴含的信息,降低了图结构在应用场景中的准确度。
技术实现思路
有鉴于此,本申请的目的在于提供一种节点嵌入表示方法和装置,能够使得得到的表示向量更加准确,提高节点表示向量在应用中的准确度。第一方面,本申请实施例提供了一种节点嵌入表示方法,该方法包括:基于图结构中节点之间的连接关系以及转移概率,生成节点序列;基于所述节点序列,为所述节点序列中的选定节点确定关联节点序列;针对所述选定节点,基于所述选定节点的关联节点序列中每个节点的特征向量,确定所述选定节点的表示向量。可选地,所述基于图结构中节点之间的连接关系以及转移概率,生成节点序列,包括:基于所述节点之间的连接关系以及所述转移概率,遍历所述图结构,生成所述节点序列。可选地,所述基于图结构中节点之间的连接关系以及转移概率,生成节点序列,包括:基于所述节点之间的连接关系,确定节点之间的转移偏置概率,使用所述转移偏置概率,更新所述节点之间的转移概率;基于所述节点之间的连接关系以及更新后的节点之间的转移概率,遍历所述图结构,生成所述节点序列。可选地,所述基于所述节点序列,为所述节点序列中的选定节点确定关联节点序列,包括:从所述节点序列中,选取包含所述选定节点的设定长度的节点子序列;将所述节点子序列中去除所述选定节点之后的序列作为所述选定节点的关联节点序列。可选地,所述基于所述节点序列,为所述节点序列中的选定节点确定关联节点序列,包括:在所述节点序列中,将位于所述选定节点前、后的预设长度的节点子序列,确定为所述选定节点的关联节点序列。第二方面,本申请实施例提供了一种节点嵌入表示装置,该装置包括:生成模块,用于基于图结构中节点之间的连接关系以及转移概率,生成节点序列;确定模块,用于基于所述节点序列,为所述节点序列中的选定节点确定关联节点序列;计算模块,用于针对所述选定节点,基于所述选定节点的关联节点序列中每个节点的特征向量,确定所述选定节点的表示向量。可选地,所述生成模块具体用于:基于所述节点之间的连接关系以及所述转移概率,遍历所述图结构,生成所述节点序列。可选地,所述生成模块具体用于:基于所述节点之间的连接关系,确定节点之间的转移偏置概率,使用所述转移偏置概率,更新所述节点之间的转移概率;基于所述节点之间的连接关系以及更新后的节点之间的转移概率,遍历所述图结构,生成所述节点序列。第三方面,本申请实施例提供了一种计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述方法的步骤。本申请实施例提供的节点嵌入表示方法,在生成节点序列时,充分考虑到图结构中节点与节点之间的关联信息、转移信息,得到的节点序列,能够更为充分地体现节点与节点之间的关系,使得基于该节点序列计算得到的节点的表示向量,能够更为准确的表示节点具有的属性特征等等,在应用节点的表示向量进行运算时,也可以提高运算结果的准确度。为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本申请实施例提供的一种节点嵌入表示方法的流程示意图;图2为本申请实施例提供的一种图结构的拓扑结构示意图;图3为本申请实施例提供的一种节点嵌入表示装置的结构示意图;图4为本申请实施例提供的一种计算机设备400的结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请实施例提供了一种节点嵌入表示方法,如图1所示,应用于节点嵌入表示系统中,该节点嵌入表示系统包括终端设备,如:计算机、笔记本电脑、平板电脑、移动电话、便携设备、车载设备等,也包括网络系统,如:视听服务系统、大屏幕系统、客户端/服务器系统(C/S)、浏览器/服务器系统、云计算系统,等等。此处并不限制节点嵌入表示系统的类型和架构。该方法包括:S101,基于图结构中节点之间的连接关系以及转移概率,生成节点序列;这里,图结构是一种复杂的数据结构,该图结构包括多个节点,图结构中包括的节点的数目一般为任意多个,可以根据实际情况确定;每个节点对应转移概率,该转移概率用于表征节点到节点之间的转移概率;图结构中的节点与节点之间的连接关系表征图结构中节点的拓扑关系,如,通过连接关系可以知道节点到节点之间的跳数、或者节点之间的路径等;节点序列中包括图结构中的所有节点,在确定节点序列中节点的顺序时,可以采用遍历图结构的方式游走所有节点,按照节点游走顺序将各节点确定为节点序列。在基于图结构中节点之间的连接关系以及转移概率,生成节点序列时,可以通过以下方式中的任意一个实现:方式一:基于所述节点之间的连接关系以及所述转移概率,遍历所述图结构,生成所述节点序列。在具体实施中,根据具有拓扑关系的图结构中节点之间的转移概率进行遍历,其中,转移概率表征节点转移到与该节点连接的可能节点的概率,从图结构中任意选择一个当前节点,根据该当前节点到其他节点的转移概率,从其他节点中为当前节点确定下一跳节点,将下一跳节点作为当前节点,重复执行上述步骤,直到遍历完图结构中所有的节点,基于遍历结果,生成所述节点序列。其中,其他节点为与当前节点间隔设定跳数的节点,设定跳数一般为预先设定的,可以为0、1、2、3等,本申请对此不予限制。在一种实施方式中,随机从图结构中选取一个节点,将该节点作为当前节点(也就是第一个节点),根据当前节点到其他节点的转移概率,将概率最大值对应的其他节点确定当前节点的下一跳节点。将确定的第一个节点的下一跳节点作为第二个节点,根据第二个节点到其他节点的转移概率,将表征最大值的概率对应的其他节点确定本文档来自技高网...

【技术保护点】
1.一种节点嵌入表示方法,其特征在于,该方法包括:基于图结构中节点之间的连接关系以及转移概率,生成节点序列;基于所述节点序列,为所述节点序列中的选定节点确定关联节点序列;针对所述选定节点,基于所述选定节点的关联节点序列中每个节点的特征向量,确定所述选定节点的表示向量。

【技术特征摘要】
1.一种节点嵌入表示方法,其特征在于,该方法包括:基于图结构中节点之间的连接关系以及转移概率,生成节点序列;基于所述节点序列,为所述节点序列中的选定节点确定关联节点序列;针对所述选定节点,基于所述选定节点的关联节点序列中每个节点的特征向量,确定所述选定节点的表示向量。2.如权利要求1所述的方法,其特征在于,所述基于图结构中节点之间的连接关系以及转移概率,生成节点序列,包括:基于所述节点之间的连接关系以及所述转移概率,遍历所述图结构,生成所述节点序列。3.如权利要求1所述的方法,其特征在于,所述基于图结构中节点之间的连接关系以及转移概率,生成节点序列,包括:基于所述节点之间的连接关系,确定节点之间的转移偏置概率,使用所述转移偏置概率,更新所述节点之间的转移概率;基于所述节点之间的连接关系以及更新后的节点之间的转移概率,遍历所述图结构,生成所述节点序列。4.如权利要求1所述的方法,其特征在于,所述基于所述节点序列,为所述节点序列中的选定节点确定关联节点序列,包括:从所述节点序列中,选取包含所述选定节点的设定长度的节点子序列;将所述节点子序列中去除所述选定节点之后的序列作为所述选定节点的关联节点序列。5.如权利要求1所述的方法,其特征在于,所述基于所述节点序列,为所述节点序列中的选定节点确定关联节点序列,包括:在所述节点序列...

【专利技术属性】
技术研发人员:杨慧萍郑凯段立新江建军
申请(专利权)人:国信优易数据有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1