当前位置: 首页 > 专利查询>东南大学专利>正文

一种基于大语言模型的通用图任务方法技术

技术编号:43932003 阅读:32 留言:0更新日期:2025-01-07 21:26
本发明专利技术涉及一种基于大语言模型(LLM)的通用图任务方法,该方法首先将图结构数据序列化为适合LLM的输入,通过RWPE(Random Walk Positional Embedding)和基于拉普拉斯分解的位置编码LAPE(Laplacian Positional Embedding)这两种编码将图的结构信息注入到模型当中完成通用序列化过程。随后根据不同的任务,进行不同的序列化,包括图分类任务中的子图切分排列与节点分类任务中的局部领域采样。在得到完全序列化的数据后,通过对预训练大模型冻结和微调的方式进行知识注入,最终本框架在图任务领域(图分类,节点分类)取得了出色的表现,并且在多个数据集上验证了框架效果,同时进行了可解释性实验与小样本场景验证实验,进一步证明了框架的优越性。

【技术实现步骤摘要】

本专利技术涉及一种基于大语言模型的通用图任务方法,属于计算机智能科学中模式识别。


技术介绍

1、图作为一种应用广泛且具有深度影响力的数据结构,在当今各领域的数据分析与处理中占据了重要的地位。现实世界中,有许多图数据的应用场景,比如在社交网络中,节点通常代表了社交用户而边通常代表用户之间的好友关系,通过分析社交网络数据,可以获得用户的行为偏好,从而为用户进行更精确的社交推荐;在蛋白质网络中,节点代表蛋白质而边通常代表蛋白质之间的交互方式,通过分析蛋白质网络数据,可以研究不同蛋白质的相互作用关系,有助于从系统的角度研究疾病分子机制、发现新药靶点。随着大数据时代的到来,图数据的规模愈发庞大,蕴含的潜在信息也愈发丰富,因此,准确、高效地挖掘图数据并合理利用数据中的信息能够有效推动产业发展、改善生活质量并提高经济收益。

2、最近,随着预训练大模型的兴起,人们对基础模型通用方法的关注达到了高潮,例如计算机视觉中的sam(segment anything model)通过学习大规模无标注或弱标注数据集中的底层特征,来获得对于图像内容的高度理解能力,使得其能够本文档来自技高网...

【技术保护点】

1.一种基于大语言模型(LLM)的通用图任务方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述基于大语言模型(LLM)的通用图任务方法,其特征在于,步骤1中,两种位置编码构造与序列化过程如下,

3.根据权利要求2所述的基于大语言模型(LLM)的通用图任务方法,其特征在于,步骤2,根据步骤1构建的两种位置编码作为输入,采用基于任务的序列化过程对数据进行进一步处理,具体包括如下子步骤:

4.根据权利要求3所述的基于大语言模型(LLM)的通用图任务方法,其特征在于,步骤3,模型冻结与微调,选用LLAMA2作为预训练大模型,在获得步骤2中的序列化...

【技术特征摘要】

1.一种基于大语言模型(llm)的通用图任务方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述基于大语言模型(llm)的通用图任务方法,其特征在于,步骤1中,两种位置编码构造与序列化过程如下,

3.根据权利要求2所述的基于大语言模型(llm)的通用图任务方法,其特征在于,步骤2,根据步骤1构建的两种位置编码作为输入,采用基于任务的序列化过程对数据进行进一步处理,具体包括如下子步骤:

4.根据权利要求3所述的基于大语言模型(llm)的通用图任务方法,其特征在于,步骤3,模型冻结与微调,选用llama2作为预训练大模型,在获得步骤2中的序列化特征s后...

【专利技术属性】
技术研发人员:孔佑勇司清华
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1