【技术实现步骤摘要】
本专利技术涉及图神经网络模型领域,尤其涉及一种提升图神经网络节点预测准确性的方法。
技术介绍
1、现实世界的图数据通常都有着丰富的节点属性。例如,文献引用网络中的文献节点以论文摘要和正文作为节点属性;商品关系网络以商家提供的商品文本描述作为节点属性;蛋白质交互网络以蛋白质序列作为节点属性。
2、然而,传统图神经网络采用采用一些简单的手工特征设计方法简化这些节点属性,丢失了节点属性中丰富的语义,导致节点预测准确率不高。例如,对于文本属性图上的节点文本属性,传统图神经网络通常采用词频向量作为节点特征,丢失了文本语义;对于蛋白质交互网络上的蛋白质序列,传统图神经网络通常直接学习蛋白质交互网络的图结构,忽略掉这些丰富但难以处理的蛋白质序列。
3、随着大语言模型的发展,出现了大量的面向文本或蛋白质序列的预训练大模型。他们首先在大量的语料库上预训练,然后在下游任务中微调来编码复杂的节点属性。然而,在下游任务中同时微调预训练大模型和图神经网络需要昂贵的计算开销,由于预训练模型的巨大模型规模和图数据本身的大规模。因此结合预训练大
...【技术保护点】
1.一种提升图神经网络节点预测准确性的方法,其特征在于,图神经网络为文献引用图结构网络、商品图谱图结构网络、蛋白质交互图结构网络中的任一种,包括:
2.根据权利要求1所述的提升图神经网络节点预测准确性的方法,其特征在于,所述方法中,若图神经网络为文献引用图结构网络,则图神经网络的节点属性的数据为文本数据;
3.根据权利要求1或2所述的提升图神经网络节点预测准确性的方法,其特征在于,所述步骤1中,按以下方式根据节点属性的数据模态选择对应的预训练大模型,包括:
4.根据权利要求3所述的提升图神经网络节点预测准确性的方法,其特征在于,所述
...【技术特征摘要】
1.一种提升图神经网络节点预测准确性的方法,其特征在于,图神经网络为文献引用图结构网络、商品图谱图结构网络、蛋白质交互图结构网络中的任一种,包括:
2.根据权利要求1所述的提升图神经网络节点预测准确性的方法,其特征在于,所述方法中,若图神经网络为文献引用图结构网络,则图神经网络的节点属性的数据为文本数据;
3.根据权利要求1或2所述的提升图神经网络节点预测准确性的方法,其特征在于,所述步骤1中,按以下方式根据节点属性的数据模态选择对应的预训练大模型,包括:
4.根据权利要求3所述的提升图神经网络节点预测准确性的方法,其特征在于,所述文本处理预训练大模型为gpt预训练大模型、...
【专利技术属性】
技术研发人员:王杰,石志皓,路方华,陈瀚铸,连得富,吴枫,
申请(专利权)人:中国科学技术大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。