【技术实现步骤摘要】
本专利技术设计一种面向多具身智能体协同博弈的智能决策方法,具体为一种基于大语言模型的多具身智能体协同博弈决策方法。
技术介绍
1、随着人工智能等高新技术的快速发展,多具身智能体协同博弈的智能决策方法研究逐渐成为协同博弈场景的热点研究领域之一。智能体的协同决策方法可以被用于协助人类决策,促进更好的合作和协同工作,推动社会进步。在军事战略博弈领域,多具身智能体协同博弈的智能决策方法在国防和安全领域也有关键作用。多具身智能体协同博弈的智能决策方法在军事战略规划中可以提供更加智能、灵活和高效的决策支持,有助于国防力量在复杂多变的安全环境中保持竞争力和优势。
2、主流的多具身智能体协同博弈场景的智能算法以基于深度强化学习为主,基于深度强化学习的协同博弈算法在自动化、复杂环境、实时决策支持、多领域应用等方面都具有显著的优势。基于深度强化学习的智能体训练过程中,可以从与环境的交互中学习,适应不同的博弈情境,无需手动制定复杂的规则,相比于基于专家知识和逻辑符号规则的传统方法,基于深度强化学习的智能体决策算法极大的改进了多具身智能体协同决策的
...【技术保护点】
1.一种基于大语言模型的多具身智能体协同博弈决策方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于大语言模型的多具身智能体协同博弈决策方法,其特征在于,实时协同博弈环境指代由一系列智能体协同博弈的推理决策的模拟环境,由多个具身智能体操控的各类角色完成各类目标与任务的环境推演过程;大语言模型指代一系列基于人工智能深度学习的生成式语言模型,具备丰富的世界知识和强大推理能力。
3.根据权利要求1所述的基于大语言模型的多具身智能体协同博弈决策方法,其特征在于,步骤一中,多具身智能体当前时刻的可视化环境状态观测信息包括:以第i-th智能体为第
...【技术特征摘要】
1.一种基于大语言模型的多具身智能体协同博弈决策方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于大语言模型的多具身智能体协同博弈决策方法,其特征在于,实时协同博弈环境指代由一系列智能体协同博弈的推理决策的模拟环境,由多个具身智能体操控的各类角色完成各类目标与任务的环境推演过程;大语言模型指代一系列基于人工智能深度学习的生成式语言模型,具备丰富的世界知识和强大推理能力。
3.根据权利要求1所述的基于大语言模型的多具身智能体协同博弈决策方法,其特征在于,步骤一中,多具身智能体当前时刻的可视化环境状态观测信息包括:以第i-th智能体为第一视角,当以博弈对抗游戏画面为载体时的rgb图像pi的图像集合或当以流式数据为载体时的以json、xml文本表征的实时观测数据。
4.根据权利要求1所述的基于大语言模型的多具身智能体协同博弈决策方法,其特征在于,步骤二中,基于多具身智能体的可视化环境状态观测,环境特征的解析与提取过程,对以流式数据为载体的博弈对抗环境的特征提取过程,具体包括以下步骤:
5.根据权利要求1所述的基于大语言模型的多具身智能体协同博弈决策方法,其特征在于,步骤二中,基于...
【专利技术属性】
技术研发人员:金伟强,王晓田,张瑜,赵彪,张紫薇,黄嘉,石博航,陶陶,闫天,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。