当前位置: 首页 > 专利查询>奥多比公司专利>正文

具有异质性的数据集的图形神经网络制造技术

技术编号:35091405 阅读:38 留言:0更新日期:2022-10-01 16:49
本公开的实施例涉及具有异质性的数据集的图形神经网络。提供了用于训练具有异质性数据集的图形神经网络并且针对具有异质性的这种数据集生成预测的技术。计算设备接收包括图形数据结构的数据集,并且使用图形神经网络来处理数据集。图形神经网络定义分别与图形数据结构的节点相对应的先验置信向量,从先验置信向量集合并且使用兼容性矩阵来执行兼容性引导传播。图形神经网络基于兼容性引导传播和节点的邻域内的至少一个节点的特性来预测图形数据结构的节点的类别标签。计算设备输出图形数据结构,其中它由软件工具可使用以用于修改计算环境的操作。计算环境的操作。计算环境的操作。

【技术实现步骤摘要】
具有异质性的数据集的图形神经网络


[0001]本公开大体上涉及图形神经网络。更具体地但不作为限制,本公开涉及用于从异质性数据集学习并针对具有异质性的这种数据集生成预测的图形神经网络。

技术介绍

[0002]图形神经网络(GNN)使用通过边互连的节点对数据集进行建模。数据集可以由GNN处理,以得出与数据集相关联的预测(例如诸如特征、类别标签、类型等)。通常,现有的GNN包括强同质性的隐式假设(例如数据集相关或具有共同特征的指示)。例如,现有的GNN假设通过边连接的图形神经网络的节点通过例如具有相同的属性值、类型、类别标签等而相关。当由GNNS处理的数据集包括强同质性时,这些GNN可能表现良好(例如根据平均绝对误差、均方根误差、正确分类百分比等)。然而,这种强同质性在现实世界数据(诸如客户简档数据或异质性图形数据)中很少观察到。在现实世界数据集中,节点通常连接至具有不同属性值、不同类型、不同类别等的节点。因此,现有的GNN在使用现实世界数据集时未能表现良好。

技术实现思路

[0003]某些实施例涉及训练具有异质性数据集的图形神经网络本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种包括利用一个或多个处理设备执行操作的方法,所述操作包括:接收包括图形数据结构的数据集;利用图形神经网络处理所述数据集以生成新的图形数据结构,其中处理所述图形神经网络至少包括:定义分别与所述图形数据结构的多个节点相对应的先验置信向量集合,使用对不同类别的多个节点被连接的概率进行建模的兼容性矩阵,从所述先验置信向量集合执行兼容性引导传播,通过所述图形神经网络,基于所述兼容性引导传播和针对所述图形数据结构的节点的邻域内的至少一个节点的特性来预测所述节点的类别标签,并且将所述类别标签分配给所述节点;以及输出所述新的图形数据结构,其中所述新的图形数据结构由软件工具可使用以用于修改计算环境的操作。2.根据权利要求1所述的方法,其中修改计算环境的所述操作包括以下一项或多项:通过从所述新的图形数据结构取回与具有所述类别标签的所述节点相对应的实体数据,来服务于对所述数据集的查询;基于所述新的图形数据结构中的、利用所述兼容性引导传播生成的类别标签,来修改所述数据集的数据元素子集;以及基于由所述新的图形数据结构中的边表示的实体关系,以特定于由具有所述类别标签的所述节点表示的目标实体的方式来修改交互式内容。3.根据权利要求1所述的方法,其中所述操作还包括至少通过以下来训练所述图形神经网络:经由对所述图形神经网络的一个或多个参数的修改,最小化损失函数,所述损失函数基于:交叉熵损失、所述神经网络的协同训练损失、以及以零为中心的所述兼容性矩阵的调节项。4.根据权利要求1所述的方法,其中所述操作还包括:使用训练数据集来针对预定数量的迭代预训练所述神经网络,以生成分别与所述图形神经网络的多个节点相对应的置信向量训练集;生成所述兼容性矩阵;以及使用所述置信向量训练集来计算针对所述兼容性矩阵的矩阵元素的值。5.根据权利要求1所述的方法,其中执行所述兼容性引导传播包括:参数化所述兼容性矩阵;以及将经参数化的所述兼容性矩阵应用于所述图形神经网络的所述节点,以将与所述节点相对应的置信向量的特性传播到所述节点的所述邻域内的多个节点。6.根据权利要求5所述的方法,其中应用经参数化的所述兼容性矩阵包括:在滑动窗口中将经参数化的所述兼容性矩阵迭代地应用于所述图形神经网络的所述多个节点。7.根据权利要求5所述的方法,其中执行所述兼容性引导传播包括:执行回声抵消,以消除与所述节点相对应的所述置信向量的所述特性的传播在后续迭代中被传播回所述节点。
8.一种包括利用一个或多个处理设备执行操作的方法,所述操作包括:访问数据集,其中所述数据集中的数据的一部分是用地面实况片段标记的;接收包括图形数据结构的图形神经网络,其中所述图形数据结构的多个节点对所述数据集进行建模;使用神经网络来针对所述图形数据结构的节点生成置信向量,所述置信向量包括所述节点的类别标签的概率;将兼容性矩阵应用于所述图形数据结构的所述节点,所述兼容性矩阵基于所述节点的邻域中的多个节点的多个置信向量来修改所述节点的所述置信向量;基于所述多个置信向量来计算损失值,其中所述损失值基于以下而被计算:(a)来自所述神经网络的协同训练损失,以及(b)保持所述兼容性矩阵的行以零为中心的调节值;基于所述损失值来更新所述兼容性矩...

【专利技术属性】
技术研发人员:R
申请(专利权)人:奥多比公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1