当前位置: 首页 > 专利查询>浙江大学专利>正文

基于大语言模型的长期任务规划方法技术

技术编号:41318366 阅读:15 留言:0更新日期:2024-05-13 14:58
本发明专利技术属于机器人技术领域,公开了基于大语言模型的长期任务规划方法,该方法基于大型语言模型,通过引入基于语言的循环神经网络结构,将任务分解和内存管理集成到大语言模型的规划推理中,从而有效提高了大语言模型的忠实性和可靠性。FLTRNN首先利用大语言模型将长期任务分解为多个子任务,形成初始抽象计划。然后,采用基于语言的循环神经网络来解决每个子任务,该网络采用长短时记忆机制来维护子任务求解所需的必要信息,确保大语言模型能够专注于当前问题相关的规则和约束。还引入了规则思维链和记忆图来增强大语言模型的推理能力。本发明专利技术通过任务分解和内存管理,减轻了大型语言模型的认知压力,提高了规则和约束的遵循能力。

【技术实现步骤摘要】

本专利技术属于机器人,尤其涉及一种基于大语言模型的长期任务规划方法


技术介绍

1、任务规划是机器人应用中的关键决策过程,广泛应用于导航、操作和日常家务等各种机器人任务中。与短期规划任务(如拾取和放置)相比,处理食物准备和桌面清理等复杂的长期任务被认为是一个具有挑战性的问题。这些任务涉及更长的动作序列和与多个对象或不同环境的交互。此外,长期任务规划更容易出现错误传播,因为早期阶段的错误可能会导致后续计划的偏离。

2、近年来,大型语言模型(大语言模型)已经被应用于各种任务。经过大量非监督文本数据的训练,大语言模型在常识推理和逻辑推理方面表现出很强的能力。已有的研究已经尝试利用大语言模型进行任务规划。这些方法通常采用上下文学习(icl)的方法。在这种范式中,大语言模型接收一个包含上下文提示(包括指令、演示等)的输入,然后输出任务的生成计划,而无需进行微调,这使得大语言模型能够在提供的上下文中学习规划策略,而无需特定的训练数据。尽管上述方法取得了突破性的进展,但是将大语言模型应用于长期任务规划仍然存在一个关键挑战,即大语言模型对上下文提示的不忠实性。本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的长期任务规划方法,其特征在于,包括以下几个步骤:

2.根据权利要求1所述的基于大语言模型的长期任务规划方法,其特征在于,在步骤1中,FLTRNN将复杂的长期任务分解为更简单的子任务,任务分解根据任务的不同方面进行划分。

3.根据权利要求1所述的基于大语言模型的长期任务规划方法,其特征在于,所述步骤2中长期记忆定义为ct,管理解决首要任务至关重要的信息,定义如下:

4.根据权利要求1所述的基于大语言模型的长期任务规划方法,其特征在于,所述步骤3的RNN框架表示为:

5.根据权利要求4所述的基于大语言模型的长期任务规划方...

【技术特征摘要】

1.一种基于大语言模型的长期任务规划方法,其特征在于,包括以下几个步骤:

2.根据权利要求1所述的基于大语言模型的长期任务规划方法,其特征在于,在步骤1中,fltrnn将复杂的长期任务分解为更简单的子任务,任务分解根据任务的不同方面进行划分。

3.根据权利要求1所述的基于大语言模型的长期任务规划方法,其特征在于,所述步骤2中长期记忆定义为ct,管理解决首要任务至关重要的信息,定义如下:

4.根据权利要求1所述的基于大语言模型的长期任务规划方法,其特征在于,所述步骤3的rnn框架表示为:

5.根据权利要求4所述的基于大语言模型的长期任务规划方法,其特征在于,基...

【专利技术属性】
技术研发人员:唐澜绫张嘉韬宋雨璠胡拓成宋伟朱世强
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1