一种图网络模型节点分类方法、装置、设备及存储介质制造方法及图纸

技术编号:33782461 阅读:14 留言:0更新日期:2022-06-12 14:37
本发明专利技术公开了一种图网络模型节点分类方法,包括:根据原始图数据构建初始图网络模型;对初始图网络模型进行调整,得到目标图网络模型;利用目标图网络模型构造正例和负例,并根据正例和负例对原始图数据中的节点进行分类。本发明专利技术实施例提供的图网络模型姐分类方法,通过对图网络模型进行预训练实现对原始图数据中未标注数据的标注,使得在最终的节点分类任务中可以利用原本未标注的数据进行学习,提高了图神经网络学习的效率与准确性。了图神经网络学习的效率与准确性。了图神经网络学习的效率与准确性。

【技术实现步骤摘要】
一种图网络模型节点分类方法、装置、设备及存储介质


[0001]本专利技术涉及图网络
,尤其涉及一种图网络模型节点分类方法、装置、设备及存储介质。

技术介绍

[0002]在图网络模型的训练和学习中,如果我们有充足的数据和标签,可以通过有监督学习得到非常好的结果。但是在现实生活中,我们常常有大量的数据而仅仅有少量的标签,而标注数据需要耗费大量的精力,若直接丢掉这些未标注的数据也很可惜。
[0003]以excel表格识别场景为例,现有的表格识别模型训练方法主要有基于GCN(图卷积网络)的表格通用训练方法、基于YOLO网络模型的表格识别训练方法和基于Faster R

CNN(快速卷积神经网络)的表格识别训练方法。
[0004]但是,第一种方法基于神经网络的模型,需要大量的标记数据,但是获得大量人工标记的数据成本很高,且从头开始训练一个GCN模型成本非常高,不利于实际应用;第二种方法仅用一个CNN(卷积神经网络)直接预测不同目标的类别与位置,不能保证准确性;第三种方法基于滑动窗口的区域选择策略无针对性,时间复杂度高,窗口冗余,且手工设计的特征对多样性的变化无很好的鲁棒性。

技术实现思路

[0005]本专利技术提供了一种图网络模型节点分类方法、装置、设备及存储介质,以提高节点分类时的高效性与准确性。
[0006]根据本专利技术的一方面,提供了一种图网络模型节点分类方法,包括:
[0007]根据原始图数据构建初始图网络模型;
[0008]对所述初始图网络模型进行调整,得到目标图网络模型;
[0009]利用所述目标图网络模型构造正例和负例,并根据所述正例和负例对所述原始图数据中的节点进行分类。
[0010]进一步地,根据原始图数据构建初始图网络模型,包括:
[0011]对所述原始图数据中的节点进行随机排序;
[0012]确定所述节点中的未标注的遮掩节点,在所述节点中去除所述遮掩节点并将剩余节点确定为目标节点;
[0013]根据所述目标节点的度信息构建所述初始图网络模型。
[0014]进一步地,对所述初始图网络模型进行调整,得到目标图网络模型,包括:
[0015]对所述初始图网络模型进行参数调试;
[0016]将参数调试后的图网络模型确定为所述目标图网络模型。
[0017]进一步地,对所述初始图网络模型进行参数调试,包括:
[0018]确定所述初始图网络模型中的一对节点;
[0019]确定所述一对节点对应的损失函数值,根据所述损失函数值调整所述初始图网络
模型的参数。
[0020]进一步地,对所述初始图网络模型进行参数调试,包括:
[0021]根据所述原始图数据创建节点级别的子任务测试集和图级别的图任务测试集;
[0022]分别利用所述子任务测试集和图任务测试集对所述初始图网络模型进行训练;
[0023]根据训练结果调整所述初始图网络模型的参数。
[0024]进一步地,利用所述目标图网络模型构造正例和负例,包括:
[0025]在所述目标图网络模型中确定至少两个起始节点;
[0026]以各所述起始节点为中心生成相应的邻居子图;
[0027]将相同起始节点对应的邻居子图确定为所述正例,将不同起始节点对应的邻居子图确定为所述负例。
[0028]进一步地,每一个所述正例和负例分别对应一个类别,根据所述正例和负例对所述原始图数据中的节点进行分类,包括:
[0029]获取所述原始图数据中的待分类节点、所述正例中包括的正例节点及所述负例中包括的负例节点;
[0030]确定所述待分类节点与所述正例节点及负例节点的连接关系;
[0031]根据所述待分类节点的相连节点所属的类别确定所述待分类节点的类别。
[0032]根据本专利技术的另一方面,提供了一种图网络模型节点分类装置,包括:
[0033]初始网络模型构建模块,用于根据原始图数据构建初始图网络模型;
[0034]初始网络模型调整模块,用于对所述初始图网络模型进行调整,得到目标图网络模型;
[0035]正例和负例构造模块,用于利用所述目标图网络模型构造正例和负例,并根据所述正例和负例对所述原始图数据中的节点进行分类。
[0036]可选的,初始网络模型构建模块还用于:
[0037]对所述原始图数据中的节点进行随机排序;
[0038]确定所述节点中的未标注的遮掩节点,在所述节点中去除所述遮掩节点并将剩余节点确定为目标节点;
[0039]根据所述目标节点的度信息构建所述初始图网络模型。
[0040]可选的,初始网络模型调整模块还用于:
[0041]对所述初始图网络模型进行参数调试;
[0042]将参数调试后的图网络模型确定为所述目标图网络模型。
[0043]可选的,初始网络模型调整模块还用于:
[0044]确定所述初始图网络模型中的一对节点;
[0045]确定所述一对节点对应的损失函数值,根据所述损失函数值调整所述初始图网络模型的参数。
[0046]可选的,初始网络模型调整模块还用于:
[0047]根据所述原始图数据创建节点级别的子任务测试集和图级别的图任务测试集;
[0048]分别利用所述子任务测试集和图任务测试集对所述初始图网络模型进行训练;
[0049]根据训练结果调整所述初始图网络模型的参数。
[0050]可选的,正例和负例构造模块还用于:
[0051]在所述目标图网络模型中确定至少两个起始节点;
[0052]以各所述起始节点为中心生成相应的邻居子图;
[0053]将相同起始节点对应的邻居子图确定为所述正例,将不同起始节点对应的邻居子图确定为所述负例。
[0054]可选的,正例和负例构造模块还用于:
[0055]获取所述原始图数据中的待分类节点、所述正例中包括的正例节点及所述负例中包括的负例节点;
[0056]确定所述待分类节点与所述正例节点及负例节点的连接关系;
[0057]根据所述待分类节点的相连节点所属的类别确定所述待分类节点的类别。
[0058]根据本专利技术的另一方面,提供了一种电子设备,所述电子设备包括:
[0059]至少一个处理器;以及
[0060]与所述至少一个处理器通信连接的存储器;其中,
[0061]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的图网络模型节点分类方法。
[0062]根据本专利技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的图网络模型节点分类方法。
[0063]本专利技术实施例首先根据原始图数据构建初始图网络本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图网络模型节点分类方法,其特征在于,包括:根据原始图数据构建初始图网络模型;对所述初始图网络模型进行调整,得到目标图网络模型;利用所述目标图网络模型构造正例和负例,并根据所述正例和负例对所述原始图数据中的节点进行分类。2.根据权利要求1所述的方法,其特征在于,根据原始图数据构建初始图网络模型,包括:对所述原始图数据中的节点进行随机排序;确定所述节点中的未标注的遮掩节点,在所述节点中去除所述遮掩节点并将剩余节点确定为目标节点;根据所述目标节点的度信息构建所述初始图网络模型。3.根据权利要求1所述的方法,其特征在于,对所述初始图网络模型进行调整,得到目标图网络模型,包括:对所述初始图网络模型进行参数调试;将参数调试后的图网络模型确定为所述目标图网络模型。4.根据权利要求3所述的方法,其特征在于,对所述初始图网络模型进行参数调试,包括:确定所述初始图网络模型中的一对节点;确定所述一对节点对应的损失函数值,根据所述损失函数值调整所述初始图网络模型的参数。5.根据权利要求3所述的方法,其特征在于,对所述初始图网络模型进行参数调试,包括:根据所述原始图数据创建节点级别的子任务测试集和图级别的图任务测试集;分别利用所述子任务测试集和图任务测试集对所述初始图网络模型进行训练;根据训练结果调整所述初始图网络模型的参数。6.根据权利要求1所述的方法,其特征在于,利用所述目标图网络模型构造正例和负例,包括:在所述目标图网络模型中确定至少两个起始节点;以各所述起始节点为中心生成相应...

【专利技术属性】
技术研发人员:罗光圣杨宇
申请(专利权)人:上海爱数信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1