一种图数据分类方法、装置、电子设备及存储介质制造方法及图纸

技术编号:40574814 阅读:16 留言:0更新日期:2024-03-06 17:15
本申请提供一种图数据分类方法、装置、电子设备及存储介质,涉及深度学习领域,用于提高迁移后的图数据分类模型的适用性和准确性。该方法包括:获取领域图和目标域的图数据;基于领域图和目标域中多个未标注的图数据对预训练语言模型进行训练,得到训练后的预训练语言模型;基于目标域中至少一个标注的图数据,对训练后的预训练语言模型进行调整,得到调整好的分类模型;分类模型用于对图数据以及图数据中的节点进行分类;基于调整好的分类模型对目标域中的图数据和/或图数据中的节点进行分类。

【技术实现步骤摘要】

本申请涉及深度学习领域,尤其涉及一种图数据分类方法、装置、电子设备及存储介质


技术介绍

1、图数据是一种具有复杂性和异构性两个特性的数据,这使得处理和分析图数据更加具有挑战性。同时,标注数据往往十分稀缺,这意味着可用于训练和验证分类模型的数据量很少,因而在进行小样本学习时很难学到有效的通用特征,进一步增加了图数据的小样本学习的难度。

2、为解决在图数据上进行小样本学习的问题提出了图神经网络(graph neuralnetwork,gnn)的方法。然而,相关技术使用gnn方法对图数据进行小样本学习时依然存在以下不足:一是相关技术使用gnn方法对图数据进行小样本学习通常会假设所有的图数据来自同一个领域,因而忽略了不同领域之间可能存在的差异。二是相关技术在进行小样本学习时,往往依赖源域中大量标注数据进行元学习或预训练,从而忽略了目标域中未标注数据的潜在价值。

3、综上,相关技术存在的问题主要是:在迁移分类模型的过程中,由于不同领域之间存在领域差异,以及目标域标注的图数据较少等原因,造成迁移后的图数据分类模型适用性不高和准确性较低的问题。本文档来自技高网...

【技术保护点】

1.一种图数据分类方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述领域图和所述目标域中多个未标注的图数据对预训练语言模型进行训练,得到训练后的预训练语言模型,包括:

3.根据权利要求2所述的方法,其特征在于,所述潜变量包括以下至少一项:语义潜变量、领域潜变量和随机潜变量;所述语义潜变量用于表征目标域中图数据在任务空间中的位置;所述领域潜变量用于表征目标域中图数据所属的领域;所述随机潜变量用于表征目标域中图数据特有的噪声。

4.根据权利要求2所述的方法,其特征在于,所述基于所述领域图、所述目标域中多个未标注的图数据和所述潜...

【技术特征摘要】

1.一种图数据分类方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述领域图和所述目标域中多个未标注的图数据对预训练语言模型进行训练,得到训练后的预训练语言模型,包括:

3.根据权利要求2所述的方法,其特征在于,所述潜变量包括以下至少一项:语义潜变量、领域潜变量和随机潜变量;所述语义潜变量用于表征目标域中图数据在任务空间中的位置;所述领域潜变量用于表征目标域中图数据所属的领域;所述随机潜变量用于表征目标域中图数据特有的噪声。

4.根据权利要求2所述的方法,其特征在于,所述基于所述领域图、所述目标域中多个未标注的图数据和所述潜变量,得到损失参数,包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述目标域中多个未标注的图数据、所...

【专利技术属性】
技术研发人员:汪悦高伟王鑫程新洲翟立柱王思维李鹏飞赵慧英谢志普
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1