提升图神经网络节点预测准确性的方法、设备及介质技术

技术编号:41347289 阅读:13 留言:0更新日期:2024-05-20 10:02
本发明专利技术公开一种提升图神经网络节点预测准确性的方法、设备及介质,方法包括:步骤1,获取图神经网络属性图的节点属性、图结构数据矩阵、节点标签数据矩阵,根据节点属性的数据模态选择对应的预训练大模型;步骤2,用图结构数据矩阵和节点标签数据矩阵计算出K跳标签;步骤3,根据K跳标签计算反标签,用反标签微调所选择预训练大模型参数的同时固定图神经网络参数;步骤4,固定微调后预训练大模型参数,向该预训练大模型输入节点属性,推理并存储相应的低维节点特征向量;步骤5,基于原始的节点标签数据矩阵训练图神经网络,用训练后的图神经网络按得出的低维节点特征向量和图结构数据矩阵进行节点属性预测。该方法能提升节点预测准确性。

【技术实现步骤摘要】

本专利技术涉及图神经网络模型领域,尤其涉及一种提升图神经网络节点预测准确性的方法。


技术介绍

1、现实世界的图数据通常都有着丰富的节点属性。例如,文献引用网络中的文献节点以论文摘要和正文作为节点属性;商品关系网络以商家提供的商品文本描述作为节点属性;蛋白质交互网络以蛋白质序列作为节点属性。

2、然而,传统图神经网络采用采用一些简单的手工特征设计方法简化这些节点属性,丢失了节点属性中丰富的语义,导致节点预测准确率不高。例如,对于文本属性图上的节点文本属性,传统图神经网络通常采用词频向量作为节点特征,丢失了文本语义;对于蛋白质交互网络上的蛋白质序列,传统图神经网络通常直接学习蛋白质交互网络的图结构,忽略掉这些丰富但难以处理的蛋白质序列。

3、随着大语言模型的发展,出现了大量的面向文本或蛋白质序列的预训练大模型。他们首先在大量的语料库上预训练,然后在下游任务中微调来编码复杂的节点属性。然而,在下游任务中同时微调预训练大模型和图神经网络需要昂贵的计算开销,由于预训练模型的巨大模型规模和图数据本身的大规模。因此结合预训练大模型与图神经网络也需本文档来自技高网...

【技术保护点】

1.一种提升图神经网络节点预测准确性的方法,其特征在于,图神经网络为文献引用图结构网络、商品图谱图结构网络、蛋白质交互图结构网络中的任一种,包括:

2.根据权利要求1所述的提升图神经网络节点预测准确性的方法,其特征在于,所述方法中,若图神经网络为文献引用图结构网络,则图神经网络的节点属性的数据为文本数据;

3.根据权利要求1或2所述的提升图神经网络节点预测准确性的方法,其特征在于,所述步骤1中,按以下方式根据节点属性的数据模态选择对应的预训练大模型,包括:

4.根据权利要求3所述的提升图神经网络节点预测准确性的方法,其特征在于,所述文本处理预训练大模型...

【技术特征摘要】

1.一种提升图神经网络节点预测准确性的方法,其特征在于,图神经网络为文献引用图结构网络、商品图谱图结构网络、蛋白质交互图结构网络中的任一种,包括:

2.根据权利要求1所述的提升图神经网络节点预测准确性的方法,其特征在于,所述方法中,若图神经网络为文献引用图结构网络,则图神经网络的节点属性的数据为文本数据;

3.根据权利要求1或2所述的提升图神经网络节点预测准确性的方法,其特征在于,所述步骤1中,按以下方式根据节点属性的数据模态选择对应的预训练大模型,包括:

4.根据权利要求3所述的提升图神经网络节点预测准确性的方法,其特征在于,所述文本处理预训练大模型为gpt预训练大模型、...

【专利技术属性】
技术研发人员:王杰石志皓路方华陈瀚铸连得富吴枫
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1