当前位置: 首页 > 专利查询>清华大学专利>正文

一种网络表示学习模型的训练方法及服务器技术

技术编号:19426764 阅读:20 留言:0更新日期:2018-11-14 10:52
本发明专利技术实施例提供一种网络表示学习模型的训练方法及服务器,所述方法包括:获取网络节点的文本信息和所述网络节点之间的关联信息;为每个网络节点初始化一个结构向量;根据所述网络节点的文本信息,获取每对相邻网络节点的文本向量,其中,所述每对相邻网络节点是根据所述网络节点之间的关联信息所获取的;根据所述结构向量和所述文本向量构成网络节点表示向量;将所述网络节点表示向量代入网络表示学习模型中,并对代入网络节点表示向量后的网络表示学习模型进行训练。所述服务器执行上述方法。本发明专利技术实施例提供的网络表示学习模型的训练方法及服务器,能够提高网络表示学习模型对网络节点分类和链路预测的准确性。

【技术实现步骤摘要】
一种网络表示学习模型的训练方法及服务器
本专利技术实施例涉及机器学习
,具体涉及一种网络表示学习模型的训练方法及服务器。
技术介绍
真实世界中的实体之间通常会互相交互,形成大规模的复杂网络。网络中的节点代表真实世界中的实体,网络中的节点之间是否连接有边代表实体之间是否存在交互关系。近些年来,已经提出了一些网络表示学习模型,即表示网络中的节点与邻居节点之间的交互关系,已有的网络表示学习模型为每个网络节点学习一个或多个固定的网络表示向量。然而,一个网络节点当与不同的邻居节点发生交互时,往往会展现出不同方面的特点(例如:一个研究者与不同的研究者发生合作关系往往因为不同的研究主题;社交媒体中的用户会因为不同的兴趣爱好与其他用户建立联系;一个Web页面往往因为不同的目的链接向其他的页面),上述网络表示学习模型面临着如下的问题:没有考虑网络节点与不同邻居节点交互内容对网络表示的影响,从而导致使用该网络表示学习模型预测各网络节点交互关系不够准确。因此,如何优化各网络节点之间的网络表示,进而提高网络表示学习模型预测效果的准确性,成为亟须解决的问题。
技术实现思路
针对现有技术存在的问题,本专利技术实施例提供一种网络表示学习模型的训练方法及服务器。第一方面,本专利技术实施例提供一种网络表示学习模型的训练方法,所述方法包括:获取网络节点的文本信息和所述网络节点之间的关联信息;为每个网络节点初始化一个结构向量;根据所述网络节点的文本信息,获取每对相邻网络节点的文本向量,其中,所述每对相邻网络节点是根据所述网络节点之间的关联信息所获取的;根据所述结构向量和所述文本向量构成网络节点表示向量;将所述网络节点表示向量代入网络表示学习模型中,并对代入网络节点表示向量后的网络表示学习模型进行训练。第二方面,本专利技术实施例提供一种网络表示学习模型的训练服务器,所述服务器包括:第一获取模块,用于获取网络节点的文本信息和所述网络节点之间的关联信息;初始化模块,用于为每个网络节点初始化一个结构向量;第二获取模块,用于根据所述网络节点的文本信息,获取每对相邻网络节点的文本向量,其中,所述每对相邻网络节点是根据所述网络节点之间的关联信息所获取的;构成模块,用于根据所述结构向量和所述文本向量构成网络节点表示向量;训练模块,用于将所述网络节点表示向量代入网络表示学习模型中,并对代入网络节点表示向量后的网络表示学习模型进行训练。第三方面,本专利技术实施例提供另一种网络表示学习模型的训练服务器,包括:处理器、存储器和总线,其中,所述处理器和所述存储器通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:获取网络节点的文本信息和所述网络节点之间的关联信息;为每个网络节点初始化一个结构向量;根据所述网络节点的文本信息,获取每对相邻网络节点的文本向量,其中,所述每对相邻网络节点是根据所述网络节点之间的关联信息所获取的;根据所述结构向量和所述文本向量构成网络节点表示向量;将所述网络节点表示向量代入网络表示学习模型中,并对代入网络节点表示向量后的网络表示学习模型进行训练。第四方面,本专利技术实施例提供一种非暂态计算机可读存储介质,包括:所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如下方法:获取网络节点的文本信息和所述网络节点之间的关联信息;为每个网络节点初始化一个结构向量;根据所述网络节点的文本信息,获取每对相邻网络节点的文本向量,其中,所述每对相邻网络节点是根据所述网络节点之间的关联信息所获取的;根据所述结构向量和所述文本向量构成网络节点表示向量;将所述网络节点表示向量代入网络表示学习模型中,并对代入网络节点表示向量后的网络表示学习模型进行训练。本专利技术实施例提供的网络表示学习模型的训练方法及服务器,能够提高网络表示学习模型对网络节点分类和链路预测的准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例网络表示学习模型的训练方法流程示意图;图2为本专利技术实施例网络表示学习模型的训练服务器结构示意图;图3为本专利技术实施例提供的服务器实体结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术实施例网络表示学习模型的训练方法流程示意图,如图1所示,本专利技术实施例提供的一种网络表示学习模型的训练方法,包括以下步骤:S1:获取网络节点的文本信息和所述网络节点之间的关联信息。具体的,服务器获取网络节点的文本信息和所述网络节点之间的关联信息。需要说明的是:网络节点可以代表现实世界中的实体,实体可以包括人或物,网络节点之间连接的边用于代表实体之间是否存在关联(即有边则实体之间有关联,没有边则实体之间没有关联),文本信息表示网络节点与相邻网络节点交互的内容(相邻网络节点可以理解为与网络节点连接有有向边的关联网络节点,有向边的方向表示了网络节点和相邻网络节点之间的相互表示关系),举例说明如下:一条由网络节点x指向网络节点y的边就表示:网络节点x对网络节点y的网络表示,同理,一条由网络节点y指向网络节点x的边就表示:网络节点y对网络节点x的网络表示。有交互关系的网络节点就认为网络节点之间具有关联信息,网络节点的相邻网络节点就可以认为与该网络节点存在交互关系,即有关联信息。还可以将获取到的文本信息和关联信息构建成社交网络数据集。S2:为每个网络节点初始化一个结构向量。具体的,服务器为每个网络节点初始化一个结构向量。该结构向量记为vs。S3:根据所述网络节点的文本信息,获取每对相邻网络节点的文本向量,其中,所述每对相邻网络节点是根据所述网络节点之间的关联信息所获取的。具体的,服务器根据所述网络节点的文本信息,获取每对相邻网络节点的文本向量,其中,所述每对相邻网络节点是根据所述网络节点之间的关联信息所获取的。网络节点x对网络节点y的文本向量表示可以记为vtx;网络节点y对网络节点x的文本向量表示可以记为vty。S4:根据所述结构向量和所述文本向量构成网络节点表示向量。具体的,服务器根据所述结构向量和所述文本向量构成网络节点表示向量。网络节点x对网络节点y的网络节点表示向量记为vx=[vsx,vtx],其中的vsx表示的是网络节点x的结构向量;同理:网络节点y对网络节点x的网络节点表示向量不再赘述。S5:将所述网络节点表示向量代入网络表示学习模型中,并对代入网络节点表示向量后的网络表示学习模型进行训练。具体的,服务器将所述网络节点表示向量代入网络表示学习模型中,并对代入网络节点表示向量后的网络表示学习模型进行训练。其中的网络表示学习模型为:其中,σ为sigmoid函数、可以表示为vx为网络节点x对网络本文档来自技高网...

【技术保护点】
1.一种网络表示学习模型的训练方法,其特征在于,包括:获取网络节点的文本信息和所述网络节点之间的关联信息;为每个网络节点初始化一个结构向量;根据所述网络节点的文本信息,获取每对相邻网络节点的文本向量,其中,所述每对相邻网络节点是根据所述网络节点之间的关联信息所获取的;根据所述结构向量和所述文本向量构成网络节点表示向量;将所述网络节点表示向量代入网络表示学习模型中,并对代入网络节点表示向量后的网络表示学习模型进行训练。

【技术特征摘要】
1.一种网络表示学习模型的训练方法,其特征在于,包括:获取网络节点的文本信息和所述网络节点之间的关联信息;为每个网络节点初始化一个结构向量;根据所述网络节点的文本信息,获取每对相邻网络节点的文本向量,其中,所述每对相邻网络节点是根据所述网络节点之间的关联信息所获取的;根据所述结构向量和所述文本向量构成网络节点表示向量;将所述网络节点表示向量代入网络表示学习模型中,并对代入网络节点表示向量后的网络表示学习模型进行训练。2.根据权利要求1所述的方法,其特征在于,所述根据所述网络节点的文本信息,获取每对相邻网络节点的文本向量,包括:分别将每对相邻网络节点中的两个网络节点x和y进行卷积运算,以获取卷积计算的结果cx和cy;根据公式F=tanh(cxacy)计算cx和cy的关联矩阵,其中,F为关联矩阵、a为预设关联规则矩阵;分别对所述关联矩阵进行行池化和列池化,并分别获取所述相邻网络节点中的两个网络节点的权重ax和ay;将vtx=cxax的计算结果作为网络节点x对网络节点y的文本向量表示,相应的,将vty=cyay的计算结果作为网络节点y对网络节点x的文本向量表示。3.根据权利要求2所述的方法,其特征在于,所述并分别获取所述相邻网络节点中的两个网络节点的权重ax和ay,包括:根据公式ax=mean(Fi,1,...,Fi,n)获取网络节点ax的权重,其中Fi,1,...,Fi,n表示关联矩阵F的行向量、mean表示取关联矩阵F的行向量平均值;根据公式ay=mean(F1,i,...,Fm,i)获取网络节点ay的权重,其中F1,i,...,Fm,i表示关联矩阵F的列向量、mean表示取关联矩阵F的列向量平均值。4.根据权利要求1或2或3所述的方法,其特征在于,所述网络表示学习模型为:其中,σ为sigmoid函数、vx为网络节点x对网络节点y的网络节点表示向量、vy为网络节点y对网络节点x的节点表示向量、vz表示与网络节点x不相连的网络节点所对应的向量、k为随机采样的网络节点z的数量、Ep(z)表示节点z服从的分布函数为p(z)的数学期望值。5.根据权利要求4所述的方法,其特征在于,所述分布函数为p(z)=dz3/4,其中,d...

【专利技术属性】
技术研发人员:孙茂松涂存超刘知远
申请(专利权)人:清华大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1