【技术实现步骤摘要】
本公开涉及人工智能和自然语言处理,尤其涉及基于kgagent提升大模型上下文理解能力的方法和装置。
技术介绍
1、近年来,随着深度学习技术特别是基于transformer的大型语言模型的激增,如chatgpt/gemini/qwen等,自然语言处理有显著的进步,使机器能够理解和生成人类语言,从而彻底改变了自然语言理解(nlu)和自然语言生成(nlg)的众多任务。但是限于transformer本身局限性不仅限制了训练期间允许的输入文本长度,而且限制了提示的有效上下文窗口,更糟糕的是,对于推理过程,llms在面对比训练中的序列更长的序列时也会遭受性能下降的困扰。同时也许由于训练数据错误或不足,或是模型本身的偏见,llms可能会产生不准确或具误导性的输出,称为“幻觉”。
2、随着算法技术迭代更新,出现很多与扩展有效上下文窗口和缓解幻觉llms相关的研究方向,包括:
3、扩展上下文窗口llms:通过研究如何训练或者微调llms来处理更长的长下文窗口,例如探索新的训练架构或者高效的transformer注意力层实现,以减少
...【技术保护点】
1.一种基于KGAgent提升大模型上下文理解能力的方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,
3.根据权利要求1所述的方法,其特征在于,所述根据所述当前问题和历史对话数据生成任务描述,包括:
4.根据权利要求1所述的方法,其特征在于,所述知识图谱库通过以下步骤进行构建:
5.根据权利要求4所述的方法,其特征在于,
6.根据权利要求1-5中任一项所述的方法,其特征在于,
7.一种基于KGAgent提升大模型上下文理解能力的装置,其特征在于,包括:
8.一种电子
...【技术特征摘要】
1.一种基于kgagent提升大模型上下文理解能力的方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,
3.根据权利要求1所述的方法,其特征在于,所述根据所述当前问题和历史对话数据生成任务描述,包括:
4.根据权利要求1所述的方法,其特征在于,所述知识图谱库通过以下步骤进行构建:
5.根据权利要求4所述的方法,...
【专利技术属性】
技术研发人员:沈伟,邵岭,黄家水,徐华泽,沈来信,郑小林,
申请(专利权)人:特斯联通用技术公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。