基于KGAgent提升大模型上下文理解能力的方法和装置制造方法及图纸

技术编号：42631206 阅读：19 留言：0更新日期：2024-09-06 01:31

本公开的实施例提供了基于KGAgent提升大模型上下文理解能力的方法和装置，应用于人工智能和自然语言处理技术领域。所述方法包括获取用户的当前问题和历史对话数据；根据所述当前问题和历史对话数据生成任务描述；根据所述任务描述在预先构建的知识图谱库中查找对应的知识组合；将所述任务描述和所述知识组合输入大语言模型中，输出对话答案。以此方式，可以基于KGAgent(知识图谱代理)系统框架来解决大型语言模型(LLMs)在处理长文本时的上下文长度限制、幻觉和性能下降的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及人工智能和自然语言处理，尤其涉及基于kgagent提升大模型上下文理解能力的方法和装置。

技术介绍

1、近年来，随着深度学习技术特别是基于transformer的大型语言模型的激增，如chatgpt/gemini/qwen等，自然语言处理有显著的进步，使机器能够理解和生成人类语言，从而彻底改变了自然语言理解(nlu)和自然语言生成(nlg)的众多任务。但是限于transformer本身局限性不仅限制了训练期间允许的输入文本长度，而且限制了提示的有效上下文窗口，更糟糕的是，对于推理过程，llms在面对比训练中的序列更长的序列时也会遭受性能下降的困扰。同时也许由于训练数据错误或不足，或是模型本身的偏见，llms可能会产生不准确或具误导性的输出，称为“幻觉”。

2、随着算法技术迭代更新，出现很多与扩展有效上下文窗口和缓解幻觉llms相关的研究方向，包括：

3、扩展上下文窗口llms：通过研究如何训练或者微调llms来处理更长的长下文窗口，例如探索新的训练架构或者高效的transformer注意力层实现，以减少对长上下文微调的需求。该方法可以提升有效上下文，但需要大量资源进行训练，依然会出现幻觉问题。

4、检索增强生成(retrieval-augmented generation,rag):rag技术允许llm从大量文档数据库中查询任务相关信息，无需任何训练，擅长回答简单的问题，粒度较粗，缓解llms上下文长度的限制，但对于复杂问题推理、跨文档问答，依然会出现上下文长度的限制。