基于KGAgent提升大模型上下文理解能力的方法和装置制造方法及图纸

技术编号:42631206 阅读:35 留言:0更新日期:2024-09-06 01:31
本公开的实施例提供了基于KGAgent提升大模型上下文理解能力的方法和装置,应用于人工智能和自然语言处理技术领域。所述方法包括获取用户的当前问题和历史对话数据;根据所述当前问题和历史对话数据生成任务描述;根据所述任务描述在预先构建的知识图谱库中查找对应的知识组合;将所述任务描述和所述知识组合输入大语言模型中,输出对话答案。以此方式,可以基于KGAgent(知识图谱代理)系统框架来解决大型语言模型(LLMs)在处理长文本时的上下文长度限制、幻觉和性能下降的问题。

【技术实现步骤摘要】

本公开涉及人工智能和自然语言处理,尤其涉及基于kgagent提升大模型上下文理解能力的方法和装置。


技术介绍

1、近年来,随着深度学习技术特别是基于transformer的大型语言模型的激增,如chatgpt/gemini/qwen等,自然语言处理有显著的进步,使机器能够理解和生成人类语言,从而彻底改变了自然语言理解(nlu)和自然语言生成(nlg)的众多任务。但是限于transformer本身局限性不仅限制了训练期间允许的输入文本长度,而且限制了提示的有效上下文窗口,更糟糕的是,对于推理过程,llms在面对比训练中的序列更长的序列时也会遭受性能下降的困扰。同时也许由于训练数据错误或不足,或是模型本身的偏见,llms可能会产生不准确或具误导性的输出,称为“幻觉”。

2、随着算法技术迭代更新,出现很多与扩展有效上下文窗口和缓解幻觉llms相关的研究方向,包括:

3、扩展上下文窗口llms:通过研究如何训练或者微调llms来处理更长的长下文窗口,例如探索新的训练架构或者高效的transformer注意力层实现,以减少对长上下文微调的需求本文档来自技高网...

【技术保护点】

1.一种基于KGAgent提升大模型上下文理解能力的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求1所述的方法,其特征在于,所述根据所述当前问题和历史对话数据生成任务描述,包括:

4.根据权利要求1所述的方法,其特征在于,所述知识图谱库通过以下步骤进行构建:

5.根据权利要求4所述的方法,其特征在于,

6.根据权利要求1-5中任一项所述的方法,其特征在于,

7.一种基于KGAgent提升大模型上下文理解能力的装置,其特征在于,包括:

8.一种电子设备,其特征在于,包...

【技术特征摘要】

1.一种基于kgagent提升大模型上下文理解能力的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求1所述的方法,其特征在于,所述根据所述当前问题和历史对话数据生成任务描述,包括:

4.根据权利要求1所述的方法,其特征在于,所述知识图谱库通过以下步骤进行构建:

5.根据权利要求4所述的方法,...

【专利技术属性】
技术研发人员:沈伟邵岭黄家水徐华泽沈来信郑小林
申请(专利权)人:特斯联通用技术公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1