异质图增强方法及装置制造方法及图纸

技术编号:37328464 阅读:10 留言:0更新日期:2023-04-21 23:06
本说明书实施例提供一种异质图增强方法及装置。在进行异质图增强时,为异质图的待增强元路径集中的各个待增强元路径构建元路径可达图;并根据所构建的元路径可达图,生成各个待增强元路径的图极限函数。然后,对于每个待增强元路径,使用对应的图极限函数进行元路径可达图采样来生成用于实现元路径内增强的第一增强元路径可达图。此外,针对待增强元路径集中的每个选定的待增强元路径对,可以根据该待增强元路径对中的各个待增强元路径的图极限函数,生成增强图极限函数;并且使用所生成的增强图极限函数进行元路径可达图采样来生成用于实现元路径间增强的第二增强元路径可达图。可达图。可达图。

【技术实现步骤摘要】
异质图增强方法及装置


[0001]本说明书实施例通常涉及图数据增强领域,尤其涉及异质图增强方法及装置。

技术介绍

[0002]数据增强可以有效提升模型泛化能力和性能,并且已经被广泛应用于计算机视觉(CV)和自然语言处理(NLP)等领域。数据增强旨在设计各种增强策略来基于现有数据在无需增加标签的情况下生成新的可信数据,以提升现有数据的数量和/或质量。图学习通常面临许多困境,比如,特征数据不完整、由于幂律(power

law)分布而导致的结构数据稀疏性、昂贵的数据注释等,数据增强天然提供了一个很好的解决方案来帮助图学习模型处理上述问题。
[0003]然而,由于图数据的不规则性和非欧几里德性,计算机视觉处理和自然语言处理中经常使用的结构化数据增强操作不能应用于图学习模型。近年来,关于图数据增强的研究越来越多。尽管取得了成功,但是所有当前增强方法都是针对同质图研发的。具有多种类型的节点和边连接的异质图通常包含比同质图更全面的信息和更丰富的语义,从而相较于同质图,异质图在现实世界中具有更多的应用范围,其应用范围例如可以包括引文网络、社交网络、推荐系统等。直接将同质图数据增强方法应用于异质图,会导致类型信息和语义信息丢失。此外,同质图数据增强方法还会引入了意外的噪声,从而影响图学习模型的性能。

技术实现思路

[0004]本说明书实施例提供异质图增强方法及装置。利用该异质图增强方法及装置,可以生成适用于异质图学习模型的高质量图增强数据。
[0005]根据本说明书实施例的一个方面,提供一种异质图增强方法,包括:为异质图的待增强元路径集中的各个待增强元路径构建元路径可达图;根据所构建的元路径可达图,生成各个待增强元路径的图极限函数;以及对于每个待增强元路径,使用对应的图极限函数进行元路径可达图采样来生成用于实现元路径内增强的第一增强元路径可达图。
[0006]可选地,在上述方面的一个示例中,所述异质图增强方法还可以包括:针对所述待增强元路径集中的每个选定的待增强元路径对,根据该待增强元路径对中的各个待增强元路径的图极限函数,生成增强图极限函数;以及使用所生成的增强图极限函数进行元路径可达图采样来生成用于实现元路径间增强的第二增强元路径可达图。
[0007]可选地,在上述方面的一个示例中,根据所构建的元路径可达图,生成各个待增强元路径的图极限函数可以包括:根据所构建的元路径可达图,利用SGWB法学习出各个待增强元路径的图极限函数。
[0008]可选地,在上述方面的一个示例中,根据该待增强元路径对中的各个待增强元路径的图极限函数,生成增强图极限函数可以包括:对该待增强元路径对中的各个待增强元路径的图极限函数进行数据混合增强,以生成增强图极限函数。
[0009]可选地,在上述方面的一个示例中,所述异质图增强方法还可以包括:获取异质图
中的待增强节点的节点特征表征、所述待增强节点的邻居节点的节点特征表征以及所述待增强节点和所述邻居节点的关系类型嵌入;将所述待增强节点的节点特征表征、所述待增强节点的邻居节点的邻居节点特征表征以及所述待增强节点和所述邻居节点的关系类型嵌入提供给关系感知的条件变分自编码机中的编码器,以得到隐变量分布;从所述隐变量分布中采样隐变量;将所采样的隐变量、所述待增强节点的节点特征表征以及所述待增强节点和所述邻居节点的关系类型嵌入提供给所述关系感知的条件变分自编码机中的解码器,以生成新的邻居节点特征表征;以及根据所述待增强节点的节点特征表征和所生成的新邻居节点特征表征,生成所述待增强节点的增强节点特征表征。
[0010]可选地,在上述方面的一个示例中,所述关系感知的条件变分自编码机利用根据所述异质图的边构建的三元组(μ,ν,e)训练出,其中,μ表示待增强节点的节点特征表征,ν表示所述待增强节点的邻居节点的邻居节点特征表征,以及e表示所述待增强节点和所述邻居节点的关系类型嵌入。
[0011]可选地,在上述方面的一个示例中,所述关系感知的条件变分自编码机训练时所使用的损失函数包括基于所生成的邻居节点特征表征与所输入的邻居节点特征表征之间的重构误差的第一损失项。
[0012]可选地,在上述方面的一个示例中,所述第一损失项包括二元交叉熵损失。
[0013]可选地,在上述方面的一个示例中,所述关系感知的条件变分自编码机训练时所使用的损失函数还包括基于所述编码器输出的隐变量分布以及所述隐变量的先验分布的KL散度的第二损失项。
[0014]根据本说明书的实施例的另一方面,提供一种异质图增强装置,包括:元路径可达图构建单元,为异质图的待增强元路径集中的各个待增强元路径构建元路径可达图;图极限函数生成单元,根据所构建的元路径可达图,生成各个待增强元路径的图极限函数;以及元路径内增强单元,对于每个待增强元路径,使用对应的图极限函数进行元路径可达图采样来生成用于实现元路径内增强的第一增强元路径可达图。
[0015]可选地,在上述方面的一个示例中,所述异质图增强装置还可以包括:元路径间增强单元,针对所述待增强元路径集中的每个选定的待增强元路径对,根据该待增强元路径对中的各个待增强元路径的图极限函数,生成增强图极限函数;以及使用所生成的增强图极限函数进行元路径可达图采样来生成用于实现元路径间增强的第二增强元路径可达图。
[0016]可选地,在上述方面的一个示例中,所述元路径间增强单元包括:图极限函数增强模块,针对所述待增强元路径集中的每个选定的待增强元路径对,根据该待增强元路径对中的各个待增强元路径的图极限函数,生成增强图极限函数;以及元路径间增强模块,使用所生成的增强图极限函数进行元路径可达图采样来生成用于实现元路径间增强的第二增强元路径可达图。
[0017]可选地,在上述方面的一个示例中,所述图极限函数生成单元根据所构建的元路径可达图,利用SGWB法学习出各个待增强元路径的图极限函数。
[0018]可选地,在上述方面的一个示例中,所述增强图极限函数生成模块对该待增强元路径对中的各个待增强元路径的图极限函数进行数据混合增强,以生成增强图极限函数。
[0019]可选地,在上述方面的一个示例中,所述异质图增强装置还可以包括:特征表征获取单元,获取异质图中的待增强节点的节点特征表征、所述待增强节点的邻居节点的节点
特征表征以及所述待增强节点和所述邻居节点的关系类型嵌入;隐变量分布生成单元,将所述待增强节点的节点特征表征、所述待增强节点的邻居节点的邻居节点特征表征以及所述待增强节点和所述邻居节点的关系类型嵌入提供给关系感知的条件变分自编码机中的编码器,以得到隐变量分布;隐变量采样单元,从所述隐变量分布中采样隐变量;邻居节点特征表征生成单元,将所采样的隐变量、所述待增强节点的节点特征表征以及所述待增强节点和所述邻居节点的关系类型嵌入提供给所述关系感知的条件变分自编码机中的解码器,以生成新的邻居节点特征表征;以及增强节点特征表征生成单元,根据所述待增强节点的节点特征表征和所生成的新邻居节点特征表征,生成所述待增强节本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异质图增强方法,包括:为异质图的待增强元路径集中的各个待增强元路径构建元路径可达图;根据所构建的元路径可达图,生成各个待增强元路径的图极限函数;以及对于每个待增强元路径,使用对应的图极限函数进行元路径可达图采样来生成用于实现元路径内增强的第一增强元路径可达图。2.如权利要求1所述的异质图增强方法,还包括:针对所述待增强元路径集中的每个选定的待增强元路径对,根据该待增强元路径对中的各个待增强元路径的图极限函数,生成增强图极限函数;以及使用所生成的增强图极限函数进行元路径可达图采样来生成用于实现元路径间增强的第二增强元路径可达图。3.如权利要求1或2所述的异质图增强方法,其中,根据所构建的元路径可达图,生成各个待增强元路径的图极限函数包括:根据所构建的元路径可达图,利用SGWB法学习出各个待增强元路径的图极限函数。4.如权利要求2所述的异质图增强方法,其中,根据该待增强元路径对中的各个待增强元路径的图极限函数,生成增强图极限函数包括:对该待增强元路径对中的各个待增强元路径的图极限函数进行数据混合增强,以生成增强图极限函数。5.如权利要求1或2所述的异质图增强方法,还包括:获取异质图中的待增强节点的节点特征表征、所述待增强节点的邻居节点的节点特征表征以及所述待增强节点和所述邻居节点的关系类型嵌入;将所述待增强节点的节点特征表征、所述待增强节点的邻居节点的邻居节点特征表征以及所述待增强节点和所述邻居节点的关系类型嵌入提供给关系感知的条件变分自编码机中的编码器,以得到隐变量分布;从所述隐变量分布中采样隐变量;将所采样的隐变量、所述待增强节点的节点特征表征以及所述待增强节点和所述邻居节点的关系类型嵌入提供给所述关系感知的条件变分自编码机中的解码器,以生成新的邻居节点特征表征;以及根据所述待增强节点的节点特征表征和所生成的新邻居节点特征表征,生成所述待增强节点的增强节点特征表征。6.如权利要求5所述的异质图增强方法,其中,所述关系感知的条件变分自编码机利用根据所述异质图的边构建的三元组(μ,ν,e)训练出,其中,μ表示待增强节点的节点特征表征,ν表示所述待增强节点的邻居节点的邻居节点特征表征,以及e表示所述待增强节点和所述邻居节点的关系类型嵌入。7.如权利要求6所述的异质图增强方法,其中,所述关系感知的条件变分自编码机训练时所使用的损失函数包括基于所生成的邻居节点特征表征与所输入的邻居节点特征表征之间的重构误差的第一损失项。8.如权利要求7所述的异质图增强方法,其中,所述第一损失项包括二元交叉熵损失。9.如权利要求7所述的异质图增强方法,其中,所述关系感知的条件变分自编码机训练
时所使用的损失函数还包括基于所述编码器输出的隐变量分布以及所述隐变量的先验分布的KL散度的第二损失项。10.一种异质图增强装置,包括:元路径可达图构建单元,为异质图的待增强元路径集中的各个待增强元路径构...

【专利技术属性】
技术研发人员:周玉晨刘永超
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1