【技术实现步骤摘要】
节点属性预测及模型训练方法、设备和存储介质
[0001]本专利技术涉及人工智能
,尤其涉及一种节点属性预测及模型训练方法、设备和存储介质。
技术介绍
[0002]由于异构图(heterogeneous graph)神经网络在概念化现实世界复杂系统方面具有优势,因此近年来得到了广泛的研究。异构图中存在不同类型的节点和边,即节点和边至少有一个具有多种类型,这个特点使得异构图的应用十分广泛,事实上,如果用图来描述我们和周围事物的关系就会发现所产生的图都是天然异构的,比如我今天看了电影T,那么“我”作为观众和电影“T”之间就建立了“看了”这个关系。异构图可以用来描述这种交互关系的集合。这个异构图中可以包括“观众”和“电影”这两类节点,以及“看了”这一类边。
[0003]节点属性预测任务是异构图应用中的一种常见的任务,比如针对某企业节点,预测其经营风险这个属性,再比如针对某作者节点,预测其所属的研究领域这个属性。
[0004]传统地,在使用一些图神经网络模型来实现上述节点属性预测任务时,其基本思路是:基于异构图中固定的推理逻辑,学习目标预测节点的向量表示(或者也可以称为嵌入表示),基于该向量表示进行目标预测节点的待预测属性值的预测,其中,目标预测节点是指需要进行属性预测的节点。这种基于异构图中固定的推理逻辑学习到的节点的向量表示,与真实的节点属性值的预测逻辑可能不匹配,导致预测结果准确性不佳。
技术实现思路
[0005]本专利技术实施例提供一种节点属性预测及模型训练方法、设备和存储介质,提 ...
【技术保护点】
【技术特征摘要】
1.一种节点属性预测方法,其特征在于,所述方法包括:接收节点属性预测任务,所述节点属性预测任务中包括设定的图模式、目标节点类型对应的待预测属性,所述图模式用于描述不同类型节点之间连接的边类型;根据所述图模式,确定以所述目标节点类型为起点的多个元路径以及从初始异构图中确定与所述图模式对应的目标异构图;获取与所述节点属性预测任务对应的节点属性预测模型,所述节点属性预测模型中包括目标因果模型,所述目标因果模型用于描述在所述图模式下与所述待预测属性相关的多个语义变量之间的因果关系;响应于对所述目标异构图中属于所述目标节点类型的目标预测节点触发的所述节点属性预测任务的执行操作,在所述目标异构图中确定所述目标预测节点在所述多个元路径下对应的多个邻居节点集合;根据所述多个邻居节点集合、所述目标预测节点以及所述目标因果模型,确定所述目标预测节点的待预测属性值。2.根据权利要求1所述的方法,其特征在于,所述根据所述多个邻居节点集合、所述目标预测节点以及所述目标因果模型,确定所述目标预测节点的待预测属性值,包括:对所述多个邻居节点集合和所述目标预测节点进行编码处理,以确定所述多个邻居节点集合和所述目标预测节点各自对应的第一向量表示;将所述多个邻居节点集合和所述目标预测节点各自对应的第一向量表示输入所述目标因果模型中,以确定所述待预测属性对应的第二向量表示;对所述待预测属性对应的第二向量表示进行解码处理,以确定所述目标预测节点的待预测属性值。3.根据权利要求2所述的方法,其特征在于,所述节点属性预测模型中包括与所述多个元路径、所述目标节点类型的节点以及所述待预测属性分别对应的编码网络,以及与所述待预测属性对应的解码网络;所述对所述多个邻居节点集合和所述目标预测节点进行编码处理,包括:采用所述多个邻居节点集合和所述目标预测节点各自对应的编码网络,对所述多个邻居节点集合和所述目标预测节点进行编码处理;所述对所述待预测属性对应的第二向量表示进行解码处理,包括:采用所述解码网络对所述待预测属性对应的第二向量表示进行解码处理。4.根据权利要求2所述的方法,其特征在于,所述目标因果模型包括邻接矩阵和多个融合网络;所述多个融合网络包括所述待预测属性对应的融合网络;所述邻接矩阵用于描述任意所述语义变量之间是否存在因果关系,所述多个融合网络反映了存在因果关系的语义变量之间的赋值函数;所述将所述多个邻居节点集合和所述目标预测节点各自对应的第一向量表示输入所述目标因果模型中,以确定所述待预测属性对应的第二向量表示,包括:将所述多个邻居节点集合和所述目标预测节点各自对应的第一向量表示以及所述邻接矩阵输入所述待预测属性对应的融合网络中,以获得所述待预测属性对应的融合网络输出的所述待预测属性对应的第二向量表示。5.一种节点属性预测模型训练方法,其特征在于,所述方法包括:
接收节点属性预测任务,所述节点属性预测任务中包括设定的图模式以及目标节点类型对应的待预测属性,所述图模式用于描述不同类型节点之间连接的边类型;根据所述图模式,确定以所述目标节点类型为起点的多个元路径以及与所述图模式对应的训练异构图;在所述训练异构图中确定目标训练样本节点以及所述目标训练样本节点对应于所述待预测属性的属性参考值,所述目标训练样本节点属于所述目标节点类型;响应于对所述目标训练样本节点触发的所述节点属性预测任务的执行操作,在所述训练异构图中确定所述目标训练样本节点在所述多个元路径下对应的多个邻居节点集合;将所述多个邻居节点集合、所述目标训练样本节点和所述待预测属性作为多个语义变量,训练与所述节点属性预测任务对应的节点属性预测模型,所述节点属性预测模型中包括目标因果模型,所述目标因果模型用于描述在所述图模式下与所述待预测属性相关的所述多个语义变量之间的因果关系,所述属性参考值作为所述节点属性预测模型的监督信息。6.根据权利要求5所述的方法,其特征在于,所述节点属性预测模型中包括与所述多个元路径、所述目标节点类型的节点以及所述待预测属性分别对应的编码网络以及与所述待预测属性对应的解码网络;所述训练与所述节点属性预测任务对应的节点属性预测模型,包括:采用所述多个语义变量自对应的编码网络,对所述多个语义变量进行编码处理,以得到所...
【专利技术属性】
技术研发人员:林田谦谨,宋凯嵩,康杨杨,蒋卓人,李旭瑞,孙常龙,刘晓钟,
申请(专利权)人:阿里巴巴达摩院杭州科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。