图数据的增广、图神经网络训练方法、装置以及设备制造方法及图纸

技术编号：33161548 阅读：17 留言：0更新日期：2022-04-22 14:19

本说明书实施例公开了图数据的增广、图神经网络训练方法、装置以及设备。增广方案包括：所述图数据包括多个节点以及节点之间的边；确定所述图数据中的指定节点以及所述指定节点的邻居节点；在所述邻居节点中选择部分节点，作为待增广节点；在所述图数据中的所述待增广节点对应的路径上，选择与所述待增广节点的距离小于预设阈值的节点，作为目标节点；将所述待增广节点与所述指定节点之间的边删除，并在所述目标节点与所述指定节点之间生成新的边，以生成增广图数据。以生成增广图数据。以生成增广图数据。

全部详细技术资料下载

【技术实现步骤摘要】
图数据的增广、图神经网络训练方法、装置以及设备

[0001]本说明书涉及人工智能领域，尤其涉及一种图数据的增广、图神经网络训练方法、装置以及设备。

技术介绍

[0002]随着计算机和互联网技术的发展，人工智能也被应用于各个领域，极大地提高了工作效率。
[0003]图神经网络（Graph Neural Networks，GNN）是一种连接主义模型，它靠图中节点之间的信息传递来捕捉图中的依赖关系，其在处理非结构化数据方面具有优秀的表现。传统的图神经网络在有监督学习方面表现突出，但是在半监督学习方面表现不尽人意，比如存在过拟合问题等。
[0004]基于此，需要针对半监督学习更准确和泛化能力更好的图神经网络方案。

技术实现思路

[0005]本说明书一个或多个实施例提供图数据的增广、图神经网络训练方法、装置、设备以及存储介质，用以解决如下技术问题：需要针对半监督学习更准确和泛化能力更好的图神经网络方案。
[0006]为解决上述技术问题，本说明书一个或多个实施例是这样实现的：本说明书一个或多个实施例提供的一种图数据的增广方法，所述图数据包括多个节点以及节点之间的边，所述方法包括：确定所述图数据中的指定节点以及所述指定节点的邻居节点；在所述邻居节点中选择部分节点，作为待增广节点；在所述图数据中的所述待增广节点对应的路径上，选择与所述待增广节点的距离小于预设阈值的节点，作为目标节点；将所述待增广节点与所述指定节点之间的边删除，并在所述目标节点与所述指定节点之间生成新的边，以生成增广图数据。r/>[0007]本说明书一个或多个实施例提供的一种图数据对应的图神经网络训练方法，所述图数据包括多个节点以及节点之间的边，所述方法包括：确定所述图数据中的指定节点以及所述指定节点的邻居节点，其中所述指定节点在所述图数据中的邻居节点作为第一邻居节点；根据所述第一邻居节点进行增广，为所述指定节点增加新的邻居节点，以生成增广图数据，其中所述指定节点在所述增广图数据中的邻居节点作为第二邻居节点；判断所述指定节点是否存在标签；若不存在，则根据所述第二邻居节点的预测结果，为所述指定节点生成伪标签；根据所述伪标签，监督所述第二邻居节点的预测结果，以训练所述图数据对应的图神经网络。
[0008]本说明书一个或多个实施例提供的一种图数据的增广装置，所述图数据包括多个节点以及节点之间的边，所述装置包括：节点确定模块，确定所述图数据中的指定节点以及所述指定节点的邻居节点；节点选择模块，在所述邻居节点中选择部分节点，作为待增广节点；距离确定模块，在所述图数据中的所述待增广节点对应的路径上，选择与所述待增广节点的距离小于预设阈值的节点，作为目标节点；边重构模块，将所述待增广节点与所述指定节点之间的边删除，并在所述目标节点与所述指定节点之间生成新的边，以生成增广图数据。
[0009]本说明书一个或多个实施例提供的一种图数据对应的图神经网络训练装置，所述图数据包括多个节点以及节点之间的边，所述装置包括：节点确定模块，确定所述图数据中的指定节点以及所述指定节点的邻居节点，其中所述指定节点在所述图数据中的邻居节点作为第一邻居节点；邻居增广模块，根据所述第一邻居节点进行增广，为所述指定节点增加新的邻居节点，以生成增广图数据，其中所述指定节点在所述增广图数据中的邻居节点作为第二邻居节点；判断模块，判断所述指定节点是否存在标签；伪标签生成模块，若所述判断模块的判断结果为不存在，则根据所述第二邻居节点的预测结果，为所述指定节点生成伪标签；监督训练模块，根据所述伪标签，监督所述第二邻居节点的预测结果，以训练所述图数据对应的图神经网络。
[0010]本说明书一个或多个实施例提供的一种图数据的增广设备，所述图数据包括多个节点以及节点之间的边，所述设备包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够：确定所述图数据中的指定节点以及所述指定节点的邻居节点；在所述邻居节点中选择部分节点，作为待增广节点；在所述图数据中的所述待增广节点对应的路径上，选择与所述待增广节点的距离小于预设阈值的节点，作为目标节点；将所述待增广节点与所述指定节点之间的边删除，并在所述目标节点与所述指定节点之间生成新的边，以生成增广图数据。
[0011]本说明书一个或多个实施例提供的一种图数据对应的图神经网络训练设备，所述图数据包括多个节点以及节点之间的边，所述设备包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够：确定所述图数据中的指定节点以及所述指定节点的邻居节点，其中所述指定节点
在所述图数据中的邻居节点作为第一邻居节点；根据所述第一邻居节点进行增广，为所述指定节点增加新的邻居节点，以生成增广图数据，其中所述指定节点在所述增广图数据中的邻居节点作为第二邻居节点；判断所述指定节点是否存在标签；若不存在，则根据所述第二邻居节点的预测结果，为所述指定节点生成伪标签；根据所述伪标签，监督所述第二邻居节点的预测结果，以训练所述图数据对应的图神经网络。
[0012]本说明书一个或多个实施例提供的一种非易失性计算机存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为：确定所述图数据中的指定节点以及所述指定节点的邻居节点；在所述邻居节点中选择部分节点，作为待增广节点；在所述图数据中的所述待增广节点对应的路径上，选择与所述待增广节点的距离小于预设阈值的节点，作为目标节点；将所述待增广节点与所述指定节点之间的边删除，并在所述目标节点与所述指定节点之间生成新的边，以生成增广图数据。
[0013]本说明书一个或多个实施例提供的一种非易失性计算机存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为：确定所述图数据中的指定节点以及所述指定节点的邻居节点，其中所述指定节点在所述图数据中的邻居节点作为第一邻居节点；根据所述第一邻居节点进行增广，为所述指定节点增加新的邻居节点，以生成增广图数据，其中所述指定节点在所述增广图数据中的邻居节点作为第二邻居节点；判断所述指定节点是否存在标签；若不存在，则根据所述第二邻居节点的预测结果，为所述指定节点生成伪标签；根据所述伪标签，监督所述第二邻居节点的预测结果，以训练所述图数据对应的图神经网络。
[0014]本说明书一个或多个实施例采用的上述至少一个技术方案能够达到以下有益效果中的至少一项：对图数据中的邻居节点进行增广，得到新的图数据（增广图数据）可用于图神经网络的训练，能够有效提高样本的多样性。并且，在增广过程中只对邻居节点进行改变，能够在扰动图数据，提高样本多样性的同时，不会严重影响到图的正确性，保证了样本的一致性，从而将监督信号传播到更多的未标记节点（不存在标签的节点），促进了图神经网络的泛化能力。
[0015]为不存在标签的节点生成伪标签，并对伪标签本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图数据的增广方法，所述图数据包括多个节点以及节点之间的边，所述方法包括：确定所述图数据中的指定节点以及所述指定节点的邻居节点；在所述邻居节点中选择部分节点，作为待增广节点；在所述图数据中的所述待增广节点对应的路径上，选择与所述待增广节点的距离小于预设阈值的节点，作为目标节点；将所述待增广节点与所述指定节点之间的边删除，并在所述目标节点与所述指定节点之间生成新的边，以生成增广图数据。2.如权利要求1所述的方法，所述在所述邻居节点中选择部分节点，作为待增广节点，具体包括：在所述邻居节点中，通过伯努利分布确定各节点对应的概率；将所述概率超过预设概率的节点，作为待增广节点。3.如权利要求1所述的方法，所述在所述图数据中的所述待增广节点对应的路径上，选择与所述待增广节点的距离小于预设阈值的节点，作为目标节点，具体包括：在所述待增广节点的邻居节点中，选择一个节点，作为目标节点。4.一种图数据对应的图神经网络训练方法，所述图数据包括多个节点以及节点之间的边，所述方法包括：确定所述图数据中的指定节点以及所述指定节点的邻居节点，其中所述指定节点在所述图数据中的邻居节点作为第一邻居节点；根据所述第一邻居节点进行增广，为所述指定节点增加新的邻居节点，以生成增广图数据，其中所述指定节点在所述增广图数据中的邻居节点作为第二邻居节点；判断所述指定节点是否存在标签；若不存在，则根据所述第二邻居节点的预测结果，为所述指定节点生成伪标签；根据所述伪标签，监督所述第二邻居节点的预测结果，以训练所述图数据对应的图神经网络。5.如权利要求4所述的方法，所述根据所述第一邻居节点进行增广，为所述指定节点增加新的邻居节点，以生成增广图数据，具体包括：在所述第一邻居节点中选择部分节点，作为待增广节点；在所述图数据中的所述待增广节点对应的路径上，选择与所述待增广节点的距离小于预设阈值的节点，作为目标节点；将所述待增广节点与所述指定节点之间的边删除，并在所述目标节点与所述指定节点之间生成新的边，以生成增广图数据。6.如权利要求4所述的方法，所述根据所述第二邻居节点的预测结果，为所述指定节点生成伪标签，具体包括：确定各所述第二邻居节点的预测结果的平均项，并将该平均项作为所述指定节点的伪标签。7.如权利要求4所述的方法，所述根据所述第二邻居节点的预测结果，为所述指定节点生成伪标签，具体包括：确定各所述第二邻居节点的预测结果的平均项，并将该平均项作为所述指定节点的初
始伪标签；对所述初始伪标签进行降熵处理，并将得到的低熵伪标签作为所述指定节点的伪标签。8.如权利要求7所述的方法，所述对所述初始伪标签进行降熵处理，具体包括：确定所述初始伪标签对应的低熵控制因子；根据所述低熵控制因子，对所述初始伪标签进行再处理，以放大所述初始伪标签的各维度的输出之间的差异程度，得到所述低熵伪标签。9.如权利要求8所述的方法，所述低熵控制因子的取值范围为(0,1]；所述根据所述低熵控制因子，对所述初始伪标签进行再处理，以放大所述初始伪标签的各维度的输出之间的差异程度，得到所述低熵伪标签，具体包括：确定所述低熵控制因子的倒数项；将所述倒数项作为所述初始伪标签的各维度的输出的指数，得到所述各维度分别对应的指数项；针对各维度，确定该维度的指数项在所述各维度的指数项之和中所占的比例，并将所述比例作为该维度在所述再处理后的输出；根据各维度的所述再处理后的输出，得到所述低熵伪标签。10.如权利要求4所述的方法，所述根据所述伪标签，监督所述第二邻居节点的预测结果，具体包括：遍历不存在标签的各所述指定节点；对遍历到的所述指定节点的各所述第二邻居节点的预测结果，分...

【专利技术属性】
技术研发人员：胡斌斌，薄德瑜，张志强，石川，王啸，周俊，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人