一种基于大语言模型的多具身智能体协同博弈决策方法技术

技术编号:41301546 阅读:22 留言:0更新日期:2024-05-13 14:48
本发明专利技术公开了一种基于大语言模型的多具身智能体协同博弈决策方法,包括:将具身智能体可视化环境观测作为输入;解析可观测智能体环境特征;基于可观测环境特征,通过大语言模型模拟智能体对环境的理解与记忆;大语言模型基于环境的理解与记忆进行综合分析,做出高层动作决策;智能体间通信设计与管理,包括何时通信、如何通信及通信内容,实现智能体间信息共享;启发式的底层动作规划,将高层动作决策映射到底层动作指令编码;跨平台指令传输,将底层动作指令编码上传至协同博弈环境,智能体做出动作,完成当前时刻环境推演;通过本发明专利技术,借助大语言模型的丰富知识和缜密优越的逻辑思维,实现对多具身智能体协同博弈场景的实时且精准的智能决策。

【技术实现步骤摘要】

本专利技术设计一种面向多具身智能体协同博弈的智能决策方法,具体为一种基于大语言模型的多具身智能体协同博弈决策方法


技术介绍

1、随着人工智能等高新技术的快速发展,多具身智能体协同博弈的智能决策方法研究逐渐成为协同博弈场景的热点研究领域之一。智能体的协同决策方法可以被用于协助人类决策,促进更好的合作和协同工作,推动社会进步。在军事战略博弈领域,多具身智能体协同博弈的智能决策方法在国防和安全领域也有关键作用。多具身智能体协同博弈的智能决策方法在军事战略规划中可以提供更加智能、灵活和高效的决策支持,有助于国防力量在复杂多变的安全环境中保持竞争力和优势。

2、主流的多具身智能体协同博弈场景的智能算法以基于深度强化学习为主,基于深度强化学习的协同博弈算法在自动化、复杂环境、实时决策支持、多领域应用等方面都具有显著的优势。基于深度强化学习的智能体训练过程中,可以从与环境的交互中学习,适应不同的博弈情境,无需手动制定复杂的规则,相比于基于专家知识和逻辑符号规则的传统方法,基于深度强化学习的智能体决策算法极大的改进了多具身智能体协同决策的性能和效率。但由于复本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的多具身智能体协同博弈决策方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于大语言模型的多具身智能体协同博弈决策方法,其特征在于,实时协同博弈环境指代由一系列智能体协同博弈的推理决策的模拟环境,由多个具身智能体操控的各类角色完成各类目标与任务的环境推演过程;大语言模型指代一系列基于人工智能深度学习的生成式语言模型,具备丰富的世界知识和强大推理能力。

3.根据权利要求1所述的基于大语言模型的多具身智能体协同博弈决策方法,其特征在于,步骤一中,多具身智能体当前时刻的可视化环境状态观测信息包括:以第i-th智能体为第一视角,当以博弈对抗...

【技术特征摘要】

1.一种基于大语言模型的多具身智能体协同博弈决策方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于大语言模型的多具身智能体协同博弈决策方法,其特征在于,实时协同博弈环境指代由一系列智能体协同博弈的推理决策的模拟环境,由多个具身智能体操控的各类角色完成各类目标与任务的环境推演过程;大语言模型指代一系列基于人工智能深度学习的生成式语言模型,具备丰富的世界知识和强大推理能力。

3.根据权利要求1所述的基于大语言模型的多具身智能体协同博弈决策方法,其特征在于,步骤一中,多具身智能体当前时刻的可视化环境状态观测信息包括:以第i-th智能体为第一视角,当以博弈对抗游戏画面为载体时的rgb图像pi的图像集合或当以流式数据为载体时的以json、xml文本表征的实时观测数据。

4.根据权利要求1所述的基于大语言模型的多具身智能体协同博弈决策方法,其特征在于,步骤二中,基于多具身智能体的可视化环境状态观测,环境特征的解析与提取过程,对以流式数据为载体的博弈对抗环境的特征提取过程,具体包括以下步骤:

5.根据权利要求1所述的基于大语言模型的多具身智能体协同博弈决策方法,其特征在于,步骤二中,基于...

【专利技术属性】
技术研发人员:金伟强王晓田张瑜赵彪张紫薇黄嘉石博航陶陶闫天
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1