【技术实现步骤摘要】
本公开属于人工智能,更具体地说,是涉及一种大语言模型指导的智能体动作控制方法及装置。
技术介绍
1、智能体控制是一种利用人工智能技术实现自动控制的方法。它通常用于辅助技术、游戏ai、机器人控制等领域,以提高用户体验和任务效率。提升智能体对智能体的操作流畅性,使其能够高效地执行各类计算机任务,是实现智能体成为人类计算机助手的不可避免挑战。
2、目前智能体控制方法主要是利用机器学习、强化学习等技术,使智能体能够根据任务自动调整其行为,但现有的智能体控制的精准性差,导致智能体执行任务作时下一个状态分布与专家的状态分布不匹配,很难解决精准性的计算机控制问题。
技术实现思路
1、本公开的目的在于提供一种大语言模型指导的智能体动作控制方法及装置,以解决目前智能体控制的精准性差的问题。
2、本公开实施例的第一方面,提供了一种大语言模型指导的智能体动作控制方法,包括:
3、基于大语言模型将目标任务转换为智能体的目标动作序列;
4、将所述目标动作序列输入至第一
...【技术保护点】
1.一种大语言模型指导的智能体动作控制方法和装置,其特征在于,包括:
2.如权利要求1所述的一种大语言模型指导的智能体动作控制方法,其特征在于,所述基于大语言模型将目标任务转换为智能体的目标动作序列,包括:
3.如权利要求2所述的一种大语言模型指导的智能体动作控制方法,其特征在于,所述根据所述子任务序列的环境状态信息对所述子任务序列进行修正得到智能体的所述目标动作序列,包括:
4.如权利要求3所述的一种大语言模型指导的智能体动作控制方法,其特征在于,所述当每个子任务的当前环境状态信息与预测环境状态信息序列存在差异时,根据差异得到修正
...【技术特征摘要】
1.一种大语言模型指导的智能体动作控制方法和装置,其特征在于,包括:
2.如权利要求1所述的一种大语言模型指导的智能体动作控制方法,其特征在于,所述基于大语言模型将目标任务转换为智能体的目标动作序列,包括:
3.如权利要求2所述的一种大语言模型指导的智能体动作控制方法,其特征在于,所述根据所述子任务序列的环境状态信息对所述子任务序列进行修正得到智能体的所述目标动作序列,包括:
4.如权利要求3所述的一种大语言模型指导的智能体动作控制方法,其特征在于,所述当每个子任务的当前环境状态信息与预测环境状态信息序列存在差异时,根据差异得到修正意见信息,包括:
5.如权利要求1所述的一种大语言模型指导的智能体动作控制方法,其特征在于,所述将所述目标动作序列输入至第一智能体控制模型...
【专利技术属性】
技术研发人员:何召锋,金永刚,项刘宇,侯金冰,王乐言,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。