一种基于分层表征的多智能体集中式决策方法、系统及存储介质技术方案

技术编号：38150808 阅读：8 留言：0更新日期：2023-07-13 09:14

本发明专利技术公开了一种基于分层表征的多智能体集中式决策方法、系统及存储介质。该方法采用基于强化学习的策略网络实现，具体包括：将多智能体感知到的态势信息输入策略网络，策略网络的第一模块基于态势信息的数据类型进行分层特征提取，对每层态势信息数据分别进行处理后进行特征融合，输出处理后的态势信息；策略网络的第二模块对处理后的态势信息进一步处理；策略网络的第三模块按照动作参数类型进行分层决策，依次处理输出各项动作参数，得到最终输出的联合动作。本发明专利技术将多智能体集中式决策时带来的高维度态势信息和动作信息采取基于类型的分层方法降低维度，有效提升了高维空间下的搜索效率。空间下的搜索效率。空间下的搜索效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于分层表征的多智能体集中式决策方法、系统及存储介质

[0001]本专利技术涉及人工智能
，尤其涉及基于多智能体强化学习和分层表征的决策优化方法、系统及存储介质。

技术介绍

[0002]近年来，以深度学习(Deep Learning，DL)为核心的智能技术取得了长足的进步，特别是以深度强化学习(Deep Reinforcement Learning，DRL)为代表的智能方法在解决雅达利游戏、棋类博弈对抗、即时策略游戏(Real
‑
Time Strategy，RTS)等决策问题上取得了众多超越人类水平的成果，使得面向自主认知的智能决策有望得到进一步发展，并取得关键性突破。强化学习(Reinforcement Learning，RL)作为解决序贯决策问题的重要方法，其通过与环境的交互试错来学习策略，恰好契合了人类的经验学习和决策思维方式，可以有效解决样本数据获取难等问题。
[0003]单智能体系统无法实现多个决策者之间的相互协作或竞争关系，往往需要多智能体通过协作来求解。多智能体系统(Multi—Agent System，MAS)是当前分布式AI领域的研究热点，其主要是通过研究智能体之间的协同和交互问题，用以解决复杂实时动态多智能体环境下的任务调度、资源分配、行为协调以及冲突消解等协同问题。
[0004]多智能体系统通常可以分为多智能体分散式决策和多智能体集中式决策两种方法。文献1公开了一种多智能体分散式决策方法，该方法中多个智能体具有高度的自治能力，自行处理信息、规划与决策、...

【技术保护点】

【技术特征摘要】
1.一种基于分层表征的多智能体集中式决策方法，其特征在于，所述决策方法采用基于强化学习的策略网络实现，所述决策方法具体包括以下步骤：S1.将多智能体感知到的态势信息输入所述策略网络，所述策略网络的第一模块基于所述态势信息的数据类型进行分层特征提取，对每层所述态势信息数据分别进行处理后进行特征融合，输出处理后的态势信息；S2.所述策略网络的第二模块对所述处理后的态势信息进一步处理；S3.所述策略网络的第三模块按照动作参数类型进行分层决策，依次处理输出各项动作参数，得到最终输出的联合动作。2.如权利要求1所述的一种基于分层表征的多智能体集中式决策方法，其特征在于，所述步骤S1具体包括：S11.对所述态势信息按照数据类型进行分层，得到分层后的态势信息；S12.根据所述分层后的态势信息的数据特点，设计不同的神经网络分别进行处理，并提取每一层态势信息相应的特征向量；S13.并行输出所述特征向量，并将所述特征向量共同输入深度长短期记忆网络，输出所述处理后的态势信息。3.如权利要求2所述的一种基于分层表征的多智能体集中式决策方法，其特征在于，所述步骤S11具体包括：将态势信息简化抽象分层，其中，所述分层至少包括地理信息、实体信息和标量信息；其中所述地理信息至少包括作战地域、地形地貌、海拔高程；所述实体信息至少包括作战实体类型、位置信息、状态信息；所述标量信息至少包括作战时间、敌我双方战损情况、作战任务及完成情况。4.如权利要求3所述的一种基于分层表征的多智能体集中式决策方法，其特征在于，所述步骤S12具体包括：至少采用卷积神经网络处理地理信息，至少采用深度自注意力网络处理实体信息，至少采用多层感知机处理标量信息。5.如权利要求1所述的一种基于分层表征的多智能体集中式决策方法，其特征在于，所述步骤S3具体包括：接收所述步骤S2中所述第二模块处理后的信息并进行分层设计，分为N个决策动作，其中N≥2且N为正整数；对于第i层决策动作(1≤i≤N)，根据该层动作特点设计相应的神经网络进行处理，得到第i层输出的决策动作a
ti
；将a
ti
传递至第i+1层进行相应的处理；所述联合动作表示为A
t
=(a
t1<...

【专利技术属性】
技术研发人员：殷昌盛，杨若鹏，杨远涛，鲁义威，韦文夏，卢稳新，何渤，
申请(专利权)人：中国人民解放军国防科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人