一种网络表示学习模型的训练方法及服务器技术

技术编号：19426764 阅读：20 留言：0更新日期：2018-11-14 10:52

本发明专利技术实施例提供一种网络表示学习模型的训练方法及服务器，所述方法包括：获取网络节点的文本信息和所述网络节点之间的关联信息；为每个网络节点初始化一个结构向量；根据所述网络节点的文本信息，获取每对相邻网络节点的文本向量，其中，所述每对相邻网络节点是根据所述网络节点之间的关联信息所获取的；根据所述结构向量和所述文本向量构成网络节点表示向量；将所述网络节点表示向量代入网络表示学习模型中，并对代入网络节点表示向量后的网络表示学习模型进行训练。所述服务器执行上述方法。本发明专利技术实施例提供的网络表示学习模型的训练方法及服务器，能够提高网络表示学习模型对网络节点分类和链路预测的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种网络表示学习模型的训练方法及服务器
本专利技术实施例涉及机器学习
，具体涉及一种网络表示学习模型的训练方法及服务器。
技术介绍
真实世界中的实体之间通常会互相交互，形成大规模的复杂网络。网络中的节点代表真实世界中的实体，网络中的节点之间是否连接有边代表实体之间是否存在交互关系。近些年来，已经提出了一些网络表示学习模型，即表示网络中的节点与邻居节点之间的交互关系，已有的网络表示学习模型为每个网络节点学习一个或多个固定的网络表示向量。然而，一个网络节点当与不同的邻居节点发生交互时，往往会展现出不同方面的特点(例如：一个研究者与不同的研究者发生合作关系往往因为不同的研究主题；社交媒体中的用户会因为不同的兴趣爱好与其他用户建立联系；一个Web页面往往因为不同的目的链接向其他的页面)，上述网络表示学习模型面临着如下的问题：没有考虑网络节点与不同邻居节点交互内容对网络表示的影响，从而导致使用该网络表示学习模型预测各网络节点交互关系不够准确。因此，如何优化各网络节点之间的网络表示，进而提高网络表示学习模型预测效果的准确性，成为亟须解决的问题。
技术实现思路
针对现有技术存在的问题，本专利技术实施例提供一种网络表示学习模型的训练方法及服务器。第一方面，本专利技术实施例提供一种网络表示学习模型的训练方法，所述方法包括：获取网络节点的文本信息和所述网络节点之间的关联信息；为每个网络节点初始化一个结构向量；根据所述网络节点的文本信息，获取每对相邻网络节点的文本向量，其中，所述每对相邻网络节点是根据所述网络节点之间的关联信息所获取的；根据所述结构向量和所述文本向量构成网络节...

【技术保护点】
1.一种网络表示学习模型的训练方法，其特征在于，包括：获取网络节点的文本信息和所述网络节点之间的关联信息；为每个网络节点初始化一个结构向量；根据所述网络节点的文本信息，获取每对相邻网络节点的文本向量，其中，所述每对相邻网络节点是根据所述网络节点之间的关联信息所获取的；根据所述结构向量和所述文本向量构成网络节点表示向量；将所述网络节点表示向量代入网络表示学习模型中，并对代入网络节点表示向量后的网络表示学习模型进行训练。

【技术特征摘要】
1.一种网络表示学习模型的训练方法，其特征在于，包括：获取网络节点的文本信息和所述网络节点之间的关联信息；为每个网络节点初始化一个结构向量；根据所述网络节点的文本信息，获取每对相邻网络节点的文本向量，其中，所述每对相邻网络节点是根据所述网络节点之间的关联信息所获取的；根据所述结构向量和所述文本向量构成网络节点表示向量；将所述网络节点表示向量代入网络表示学习模型中，并对代入网络节点表示向量后的网络表示学习模型进行训练。2.根据权利要求1所述的方法，其特征在于，所述根据所述网络节点的文本信息，获取每对相邻网络节点的文本向量，包括：分别将每对相邻网络节点中的两个网络节点x和y进行卷积运算，以获取卷积计算的结果cx和cy；根据公式F＝tanh(cxacy)计算cx和cy的关联矩阵，其中，F为关联矩阵、a为预设关联规则矩阵；分别对所述关联矩阵进行行池化和列池化，并分别获取所述相邻网络节点中的两个网络节点的权重ax和ay；将vtx＝cxax的计算结果作为网络节点x对网络节点y的文本向量表示，相应的，将vty＝cyay的计算结果作为网络节点y对网络节点x的文本向量表示。3.根据权利要求2所述的方法，其特征在于，所述并分别获取所述相邻网络节点中的两个网络节点的权重ax和ay，包括：根据公式ax＝mean(Fi,1,...,Fi,n)获取网络节点ax的权重，其中Fi,1,...,Fi,n表示关联矩阵F的行向量、mean表示取关联矩阵F的行向量平均值；根据公式ay＝mean(F1,i,...,Fm,i)获取网络节点ay的权重，其中F1,i,...,Fm,i表示关联矩阵F的列向量、mean表示取关联矩阵F的列向量平均值。4.根据权利要求1或2或3所述的方法，其特征在于，所述网络表示学习模型为：其中，σ为sigmoid函数、vx为网络节点x对网络节点y的网络节点表示向量、vy为网络节点y对网络节点x的节点表示向量、vz表示与网络节点x不相连的网络节点所对应的向量、k为随机采样的网络节点z的数量、Ep(z)表示节点z服从的分布函数为p(z)的数学期望值。5.根据权利要求4所述的方法，其特征在于，所述分布函数为p(z)＝dz3/4，其中，d...

【专利技术属性】
技术研发人员：孙茂松，涂存超，刘知远，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人