一种联合学习稀疏属性网络表征方法及系统技术方案

技术编号:20875031 阅读:18 留言:0更新日期:2019-04-17 11:15
本发明专利技术公开了一种联合学习稀疏属性网络表征方法及系统,该方法包括:在目标网络中确定训练样本;将目标网络中的节点和其属性进行投影,生成所述目标网络中各个节点的表征向量;利用所述训练样本中每个节点的相邻节点进行节点出现概率预测,并基于节点之间的属相相似度为每个节点的相邻节点分配不同的权重值;基于各个节点的表征向量和各个节点分配获得的权重值,生成目标函数;对所述目标函数进行优化,并融合网络结构的相似性和节点属性信息,使得学习到的节点向量表征同时维持网络结构和节点属性的相似关系。本发明专利技术能够有效地捕捉节点和自身稀疏属性之间的交互关系,缓解节点属性稀疏的问题。

【技术实现步骤摘要】
一种联合学习稀疏属性网络表征方法及系统
本专利技术涉及网络分析
,特别是涉及一种联合学习稀疏属性网络表征方法及系统。
技术介绍
随着表征学习技术的不断发展,一系列的网络表示学习的方法被提出,通过维持节点之间的网络结构的关系来为网络中每个节点学习一个低维的向量表征,这些学习到的节点向量表征能够直接被作为节点的自身特征来应用到后续的网络分析任务中,如节点的分类、链接预测和网络聚类等任务。但是,现有技术中的工作主要集中在学习节点之间的网络结构关系,而忽略了很多网络中节点自身的属性信息。在实际的生活中,网络中的节点自身的属性信息是比较常见的,比如社交网络中用户的偏好和资料信息,合著网络中文章的标题和内容信息。这些节点自身的属性能够一定程度地反应网络节点之间的相似关系,因此,可以利用节点的属性信息能够有效缓解网络结构的稀疏性,从而帮助学习节点的向量表征。虽然现有技术中也有通过融合节点的属性信息来学习节点的表征,但是这些方法仍存在一些不足。具体的,在实际的应用情境中,例如在社交网络中,节点的自身属性信息通常是非常稀疏和高纬度的,现有技术中的模型的性能常常因为节点属性的稀疏性而受到很大影响。其次,在网络中节点之间的链接权重关系并不是完全相同的,因此,现有技术中都无法有效缓解属性网络中节点属性的稀疏性的问题。
技术实现思路
针对于上述问题,本专利技术提供一种联合学习稀疏属性网络表征方法及系统,实现了有效缓解属性网络中节点属性的稀疏性的目的。为了实现上述目的,本专利技术提供了如下技术方案:一种联合学习稀疏属性网络表征方法,包括:在目标网络中确定训练样本;将目标网络中的节点和其属性进行投影,生成所述目标网络中各个节点的表征向量;利用所述训练样本中每个节点的相邻节点进行节点出现概率预测,获得预测值,所述预测值用来维持网络结构的相似性;基于节点之间的属性相似度,为每个节点的相邻节点分配不同的权重值;基于各个节点的表征向量和各个节点分配获得的权重值,生成目标函数;对所述目标函数进行优化,并融合网络结构的相似性和节点属性信息,使得学习到的节点向量表征同时维持网络结构和节点属性的相似关系。可选地,所述在目标网络中确定训练样本,包括:将目标网络中的每个节点作为初始的根节点;对所述根节点进行截断式随机游走,生成固定长度的随机游走序列,将所述随机游走序列确定为训练样本。可选地,所述将目标网络中的节点和其属性进行投影,生成所述目标网络中各个节点的表征向量,包括:将目标网络中的节点和其属性分别投影至相同维度的低维空间中;采用预设矩阵来表示投影后的节点和其属性,生成向量映射矩阵;基于所述向量映射矩阵,计算获得各个节点的表征向量。可选地,该方法还包括:若节点对应的属性数量不满足预设要求,则确定所述节点的邻居信息;生成所述邻居信息的属性向量表达式;基于所述邻居信息的属性向量表达式,生成所述节点的表征向量。可选地,所述利用所述训练样本中每个节点的相邻节点进行节点出现概率预测,获得预测值,包括:在所述训练样本中确定节点周围距离满足预设距离的相邻节点;利用所述相邻节点对节点的自身出现概率进行预测,获得预测值,所述预测值用来维持网络结构的相似性。可选地,所述基于各个节点的表征向量和各个节点分配获得的权重值,生成目标函数,包括:根据节点的表征向量和分配给每个相邻节点的权重值,计算获得相邻节点的综合向量;对所述每个相邻节点的权重值进行归一化处理,并基于所述相邻节点的综合向量,生成目标函数。可选地,所述对目标函数进行优化,包括:根据节点的噪声分布对相邻节点选取若干个节点作为中心节点,并利用所述中心节点来生成训练数据的负样本;依据所述负样本对所述目标函数进行修改,获得修改后的目标函数;采用随机梯度下降算法进行迭代更新参数,对所述修改后的目标函数进行最小化目标函数值。可选地,该方法还包括:基于所述目标函数生成学习模型;对所述学习模型进行评估,实现评估学习模型学习到稀疏属性网络的节点表征向量的特性。可选地,所述对所述学习模型进行评估,包括:多标签节点分类评估或者链接预测评估;所述多标签节点分类评估,用于将基于所述学习模型学习到的节点表征向量作为节点特征;将目标网络的节点划分为训练数据和测试数据;所述节点特征、训练数据和测试数据输入至分类器中,实现对所述学习模型的评估;所述连接预测评估,用于确定测试数据,利用所述学习模型获得每个节点的表征向量;根据表征向量进行排序,确定候选的链接节点;基于所述链接节点和所述测试数据对所述学习模型进行评估。一种联合学习稀疏属性网络表征系统,包括:样本确定单元,用于在目标网络中确定训练样本;向量生成单元,用于将目标网络中的节点和其属性进行投影,生成所述目标网络中各个节点的表征向量;预测单元,用于利用所述训练样本中每个节点的相邻节点进行节点出现概率预测,获得预测值,所述预测值用来维持网络结构的相似性;权重分配单元,用于基于节点之间的属性相似度,为每个节点的相邻节点分配不同的权重值;目标函数生成单元,用于基于各个节点的表征向量和各个节点分配获得的权重值,生成目标函数;优化单元,用于对所述目标函数进行优化,并融合网络结构的相似性和节点属性信息,使得学习到的节点向量表征同时维持网络结构和节点属性的相似关系。相较于现有技术,本专利技术提供了一种联合学习稀疏属性网络表征方法及系统,通过将目标网络中的节点和对应的属性进行投影,获得各个节点的表征向量,使得具有相似属性和网络结构的节点的表征向量更加相似,并且能够基于训练样本中相邻节点进行节点出现概率的预测,然后依据节点之间的属性相似度为每个相邻节点分配不同的权重,使得节点之间有不同的权重关系,从而使得相似的网络结构中,具有相似属性的节点表征向量更加相似,这样生成的目标函数为网络中每个节点学习到一个更好的低维表征向量,进而能够有效地捕捉节点和自身稀疏属性之间的交互关系,缓解节点属性稀疏的问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本专利技术实施例提供的一种联合学习稀疏属性网络表征方法的流程示意图;图2为本专利技术实施例提供的一种生成节点表征向量的方法的流程示意图;图3为本专利技术实施例提供的一种联合学习稀疏属性网络表征系统的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的说明书和权利要求书及上述附图中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有设定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。在本专利技术实施例中提供了一种联合学习稀疏属性网络表征方法,参见图1,该方法包括:S101、在目标网络本文档来自技高网...

【技术保护点】
1.一种联合学习稀疏属性网络表征方法,其特征在于,包括:在目标网络中确定训练样本;将目标网络中的节点和其属性进行投影,生成所述目标网络中各个节点的表征向量;利用所述训练样本中每个节点的相邻节点进行节点出现概率预测,获得预测值,所述预测值用来维持网络结构的相似性;基于节点之间的属性相似度,为每个节点的相邻节点分配不同的权重值;基于各个节点的表征向量和各个节点分配获得的权重值,生成目标函数;对所述目标函数进行优化,并融合网络结构的相似性和节点属性信息,使得学习到的节点向量表征同时维持网络结构和节点属性的相似关系。

【技术特征摘要】
1.一种联合学习稀疏属性网络表征方法,其特征在于,包括:在目标网络中确定训练样本;将目标网络中的节点和其属性进行投影,生成所述目标网络中各个节点的表征向量;利用所述训练样本中每个节点的相邻节点进行节点出现概率预测,获得预测值,所述预测值用来维持网络结构的相似性;基于节点之间的属性相似度,为每个节点的相邻节点分配不同的权重值;基于各个节点的表征向量和各个节点分配获得的权重值,生成目标函数;对所述目标函数进行优化,并融合网络结构的相似性和节点属性信息,使得学习到的节点向量表征同时维持网络结构和节点属性的相似关系。2.根据权利要求1所述的方法,其特征在于,所述在目标网络中确定训练样本,包括:将目标网络中的每个节点作为初始的根节点;对所述根节点进行截断式随机游走,生成固定长度的随机游走序列,将所述随机游走序列确定为训练样本。3.根据权利要求2所述的方法,其特征在于,所述将目标网络中的节点和其属性进行投影,生成所述目标网络中各个节点的表征向量,包括:将目标网络中的节点和其属性分别投影至相同维度的低维空间中;采用预设矩阵来表示投影后的节点和其属性,生成向量映射矩阵;基于所述向量映射矩阵,计算获得各个节点的表征向量。4.根据权利要求3所述的方法,其特征在于,该方法还包括:若节点对应的属性数量不满足预设要求,则确定所述节点的邻居信息;生成所述邻居信息的属性向量表达式;基于所述邻居信息的属性向量表达式,生成所述节点的表征向量。5.根据权利要求4所述的方法,其特征在于,所述利用所述训练样本中每个节点的相邻节点进行节点出现概率预测,获得预测值,包括:在所述训练样本中确定节点周围距离满足预设距离的相邻节点;利用所述相邻节点对节点的自身出现概率进行预测,获得预测值,所述预测值用来维持网络结构的相似性。6.根据权利要求5所述的方法,其特征在于,所述基于各个节点的表征向量和各个节点分配获得的权重值,生成目标函数,包括:根据节点的表征向量和分配给每个相邻节点的权重值,计算获得相邻节...

【专利技术属性】
技术研发人员:陈恩红王皓刘淇徐童
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1