一种基于异质图神经网络的数据处理方法及装置制造方法及图纸

技术编号:38570121 阅读:16 留言:0更新日期:2023-08-22 21:05
本申请提供一种基于异质图神经网络的数据处理方法,包括:获取目标业务的异质图信息,异质图包括多个节点和表征多个节点连接关系的连接边;基于多条元路径,确定各条元路径对应的目标节点的邻居节点;基于各条元路径对应的目标节点与各个邻居节点的转移概率,以及目标节点与各个邻居节点的相似性,确定各条元路径对应的目标节点的各个邻居节点的置信度;将置信度达标的各条元路径对应的目标节点的邻居节点进行聚合,确定各条元路径对应的目标节点的节点级嵌入表示;将各条元路径对应的目标节点的节点级嵌入表示进行聚合,确定目标节点的语义级嵌入表示,语义级嵌入表示用于实现目标业务的预测任务。本申请的异质图神经网络具有很好的鲁棒性。有很好的鲁棒性。有很好的鲁棒性。

【技术实现步骤摘要】
一种基于异质图神经网络的数据处理方法及装置


[0001]本申请涉及人工智能
,尤其涉及一种基于异质图神经网络的数据处理方法及装置。

技术介绍

[0002]现有的异质图神经网络虽然在许多应用中得到广泛使用,但其还面临着对抗攻击问题,导致其在鲁棒性方面存在着许多不足。

技术实现思路

[0003]本申请的实施例提供一种基于异质图神经网络的数据处理方法及装置,使异质图神经网络可以对抗攻击,具有较好的鲁棒性。
[0004]第一方面,本申请实施例提供了一种基于异质图神经网络的数据处理方法,包括:获取目标业务的异质图信息,异质图包括多个节点和表征多个节点连接关系的连接边,多个节点中包括多种类型的节点,多个节点中不同类型的节点表示目标业务的业务数据中不同类型的对象;基于多条元路径,确定各条元路径对应的目标节点的邻居节点;基于各条所述元路径对应的目标节点与目标节点的各个所述邻居节点的转移概率,以及目标节点与目标节点的各个所述邻居节点的相似性,确定各条元路径对应的目标节点的各个邻居节点的置信度;将置信度达标的各条元路径对应的目标节点的邻居节点进行聚合,确定各条元路径对应的目标节点的节点级嵌入表示;将各条元路径对应的目标节点的节点级嵌入表示进行聚合,确定目标节点的语义级嵌入表示,语义级嵌入表示用于实现目标业务的预测任务。
[0005]示例性的,目标业务可以是研究领域中论文与作者关系预测业务、电子商务领域中为用户推荐商品业务、金融领域中欺诈用户检测业务等。
[0006]本申请实施例提供的基于异质图神经网络的数据处理方法,通过目标节点到其每个邻居节点的转移概率和目标节点和其各个邻居节点的相似性作为判据,判断目标节点的各个邻居节点的置信度,过滤掉置信度不达标的邻居节点(不达标的邻居节点为攻击节点),以获得真实有效的邻居节点,增加了异质图神经网络的对抗攻击能力,提高了异质图神经网络的鲁棒性。
[0007]在一个可能的实现中,上述基于各条元路径对应的所述目标节点与目标节点的各个邻居节点的转移概率,以及目标节点与目标节点的各个所述邻居节点的相似性,确定各条元路径对应的目标节点的各个邻居节点的置信度,包括:基于各条所述元路径对应的所述目标节点与目标节点的各个所述邻居节点的转移概率,确定各条元路径对应的目标节点的各个邻居节点的先验置信度;基于各条元路径对应的目标节点的各个邻居节点的先验置信度和目标节点与目标节点的各个邻居节点的相似性,确定各条元路径对应的目标节点的各个邻居节点的置信度。
[0008]在一个可能的实现中,各条元路径对应的目标节点与各个邻居节点的转移概率基于目标节点与目标节点的各个邻居节点的转移频率确定,具体而言,目标节点与邻居节点
的转移概率基于目标节点与目标节点的转移频率负相关。
[0009]在另一个可能的实现中,异质图信息包括节点特征矩阵,节点特征矩阵包括多个节点中各个节点的初始语义特征,节点的初始语义特征表征节点对应的对象的自身属性信息;将节点特征矩阵中不同类型的节点初始语义特征映射至公共特征空间,确定多个节点中各个节点的转换特征;基于目标节点的转换特征和目标节点的各个邻居节点的转换特征,确定目标节点与目标节点的各个邻居节点的相似性。
[0010]在另一个可能的实现中,邻居节点的置信度大于或等于预设阈值,则确定邻居节点的置信度达标;或者,对目标节点的邻居节点的置信度进行降序排列,前T个邻居节点为达标的邻居节点。
[0011]在另一个可能的实现中,上述将置信度达标的各条元路径对应的目标节点的邻居节点进行聚合,确定各条元路径对应的目标节点的节点级嵌入表示,包括:基于节点级的注意力机制确定各条元路径对应的目标节点的达标的邻居节点的注意力权重;基于各条元路径对应的目标节点的达标的邻居节点的注意力权重,对置信度达标的各条元路径对应的目标节点的邻居节点进行聚合,确定各条元路径对应的目标节点的节点级嵌入表示。
[0012]在一个示例中,上述将各条元路径对应的目标节点的节点级嵌入表示进行聚合,确定目标节点的语义级嵌入表示,包括:基于语义级的注意力机制确定各条元路径对应的目标节点的节点级嵌入表示的注意力权重;基于各条元路径对应的目标节点的节点级嵌入表示的注意力权重,对各条元路径对应的目标节点的节点级嵌入表示进行聚合,确定目标节点的语义级嵌入表示。
[0013]在另一个可能的实现中,目标业务的预测任务包括节点分类预测任务、链接预测任务、聚类任务、推荐任务、异常检测任务中的一个或多个。
[0014]第二方面,本申请实施例提出一种基于异质图神经网络的数据处理装置,包括:
[0015]获取模块,用于获取目标业务的异质图信息,所述异质图包括多个节点和表征多个节点连接关系的连接边,所述多个节点中包括多种类型的节点,所述多个节点中不同类型的节点表示所述目标业务的业务数据中不同类型的对象;
[0016]第一确定模块,用于基于多条元路径,确定各条所述元路径对应的目标节点的邻居节点;
[0017]第二确定模块,用于基于各条所述元路径对应的所述目标节点与所述目标节点的各个所述邻居节点的转移概率,以及所述目标节点与所述目标节点的各个所述邻居节点的相似性,确定各条所述元路径对应的所述目标节点的各个所述邻居节点的置信度;
[0018]节点级聚合模块,用于将所述置信度达标的各条所述元路径对应的所述目标节点的邻居节点进行聚合,确定各条所述元路径对应的目标节点的节点级嵌入表示;
[0019]语义级聚合模块,用于将各条所述元路径对应的目标节点的节点级嵌入表示进行聚合,确定所述目标节点的语义级嵌入表示,所述语义级嵌入表示用于实现所述目标业务的预测任务。
[0020]在一个可能的实现中,所述第二确定模块具体用于,基于所述各条所述元路径对应的所述目标节点与所述目标节点的各个所述邻居节点的转移概率,确定所述各条所述元路径对应的所述目标节点的各个所述邻居节点的先验置信度;
[0021]基于所述各条所述元路径对应的所述目标节点的各个所述邻居节点的先验置信
度和所述目标节点与所述目标节点的各个所述邻居节点的相似性,确定各条所述元路径对应的所述目标节点的各个所述邻居节点的置信度。
[0022]在另一个可能的实现中,所述各条所述元路径对应的所述目标节点与各个所述邻居节点的转移概率基于所述目标节点与所述目标节点的各个所述邻居节点的转移频率确定。
[0023]在另一个可能的实现中,所述异质图信息包括节点特征矩阵,所述节点特征矩阵包括所述多个节点中各个节点的初始语义特征,所述节点的初始语义特征表征所述节点对应的对象的自身属性信息;
[0024]将所述节点特征矩阵中不同类型的节点初始语义特征映射至公共特征空间,确定所述多个节点中各个节点的转换特征;
[0025]基于所述目标节点的转换特征和所述目标节点的各个所述邻居节点的转换特征,确定所述目标节点与所述目标节点的各个所述邻居节点的相似性。
[0026]在另一个可能的实现中,所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于异质图神经网络的数据处理方法,其特征在于,包括:获取目标业务的异质图信息,所述异质图包括多个节点和表征多个节点连接关系的连接边,所述多个节点中包括多种类型的节点,所述多个节点中不同类型的节点表示所述目标业务的业务数据中不同类型的对象;基于多条元路径,确定各条所述元路径对应的目标节点的邻居节点;基于各条所述元路径对应的所述目标节点与所述目标节点的各个所述邻居节点的转移概率,以及所述目标节点与所述目标节点的各个所述邻居节点的相似性,确定各条所述元路径对应的所述目标节点的各个所述邻居节点的置信度;将所述置信度达标的各条所述元路径对应的所述目标节点的邻居节点进行聚合,确定各条所述元路径对应的目标节点的节点级嵌入表示;将各条所述元路径对应的目标节点的节点级嵌入表示进行聚合,确定所述目标节点的语义级嵌入表示,所述语义级嵌入表示用于实现所述目标业务的预测任务。2.根据权利要求1所述的方法,其特征在于,所述基于各条所述元路径对应的所述目标节点与所述目标节点的各个所述邻居节点的转移概率,以及所述目标节点与所述目标节点的各个所述邻居节点的相似性,确定各条所述元路径对应的所述目标节点的各个所述邻居节点的置信度,包括:基于所述各条所述元路径对应的所述目标节点与所述目标节点的各个所述邻居节点的转移概率,确定所述各条所述元路径对应的所述目标节点的各个所述邻居节点的先验置信度;基于所述各条所述元路径对应的所述目标节点的各个所述邻居节点的先验置信度和所述目标节点与所述目标节点的各个所述邻居节点的相似性,确定各条所述元路径对应的所述目标节点的各个所述邻居节点的置信度。3.根据权利要求1或2所述的方法,其特征在于,所述各条所述元路径对应的所述目标节点与各个所述邻居节点的转移概率基于所述目标节点与所述目标节点的各个所述邻居节点的转移频率确定。4.根据权利要求1

3任一项所述的方法,其特征在于,所述异质图信息包括节点特征矩阵,所述节点特征矩阵包括所述多个节点中各个节点的初始语义特征,所述节点的初始语义特征表征所述节点对应的对象的自身属性信息;将所述节点特征矩阵中不同类型的节点初始语义特征映射至公共特征空间,确定所述多个节点中各个节点的转换特征;基于所述目标节点的转换特征和所述目标节点的各个所述邻居节点的转换特征,确定所述目标节点与所述目标节点的各个所述邻居节点的相似性。5.根据权利要求1

4任一项所述的方法,其特征在于,所述邻居节点的置信度大于或等于预设阈值,则确定所述邻居节点的置信度达标。6.根据权利要求1

5任一项所述的方法,其特征在于,所述将所述置信度达标的各条所述元路径对应的所述目标节点的邻居节点进行聚合,确定各条所述元路径对应的目标节点的节点级嵌入表示,包括:基于节点级的注意力机制确定所述各条所述元路径对应的目标节点的达标的邻居节点的注意力权重;
基于所述各条所述元路径对应的目标节点的达标的邻居节点的注意力权重,对所述置信度达标的各条所述元路径对应的所述目标节点的邻居节点进行聚合,确定各条所述元路径对应的目标节点的节点级嵌入表示。7.根据权利要求1

6任一项所述的方法,其特征在于,所述将各条所述元路径对应的目标节点的节点级嵌入表示进行聚合,确定所述目标节点的语义级嵌入表示,包括:基于语义级的注意力机制确定所述各条元路径对应的目标节点的节点级嵌入表示的注意力权重;基于所述各条元路径对应的目标节点的节点级嵌入表示的注意力权重,对所述各条元路径对应的目标节点的节点级嵌入表示进行聚合,确定所述目标节点的语义级嵌入表示。8.根据权利要求1

7任一项所述的方法,其特征在于,所述目标业务的预测任务包括节点分类预测任务、链接预测任务、聚类任务、推荐任务、异常检测任务中的一个或多个。9.一种基于异质图神经网络的数据处理装置,其特征在于,包...

【专利技术属性】
技术研发人员:石川王啸王桂凤张梦玫
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1