一种基于SWOT分析和行为树的多智能体无人对抗系统的决策方法技术方案

技术编号:37152959 阅读:11 留言:0更新日期:2023-04-06 22:11
本发明专利技术公开了一种基于SWOT分析和行为树的多智能体无人对抗系统的决策方法,可以用于真实的多智能体无人自主对抗系统,使用SWOT分析法帮助行为树选择非异常动作类型,实现简单且具有良好的可解释性和一定的自适应能力,避免了传统方法需要人工设计条件节点的限制;设计了分布式的通信和计算框架,实现了去中心化,合理分配计算资源,符合高维状态下真实多智能体无人对抗即时决策系统的应用背景;设计了层次的行为决策结构,具有决策精度递增的特点,有利于智能体自发实现行为自组织,有利于提高真实多智能体无人系统中即时决策的鲁棒性。性。性。

【技术实现步骤摘要】
一种基于SWOT分析和行为树的多智能体无人对抗系统的决策方法


[0001]本专利技术涉及多智能体即时决策对抗技术,属于机器人及人工智能
,具体涉及一种基于SWOT分析和行为树的多智能体无人对抗系统的决策方法。

技术介绍

[0002]现有技术中,大多决策技术只能解决单智能体或游戏环境,无法解决现实世界的复杂多智能体对抗系统的即时决策任务。针对多智能体自主无人对抗系统,现有的决策方法仍然存在以下问题:
[0003]1、多智能体即时行为决策方法大多依赖基于规则预先设定的逻辑来执行,需要仔细考虑各种可能出现的情况并给出决策方案。如史殿习在专利《一种基于行为树的机器人行为控制方法及装置》中提出了一种基于行为树的机器人行为控制方法及装置,这类方法需要仔细设计各节点之间的逻辑关系,费时费力且容易考虑不周,容易产生逻辑混乱。在解决对抗任务时,为了保证逻辑的严谨性,行为树的结构一般会非常复杂,优化和测试逻辑难度较大。传统的基于行为树的方法逻辑固定,自适应性和灵活性也比较差。
[0004]2、SWOT分析法出自管理学,常常被应用在企业发展战略制定、竞争对手分析中,帮助企业分析自身优势和所处经营环境,从而做出合理的决策。但是由于该方法得出的结果一般是供人参考的,所以决策结果不是智能体直接可执行的,较难将其直接应用于在多智能体无人对抗系统中。有少量方法应用在军事博弈中,如张长春在论文《基于SWOT分析法的联合侦察优势互补研究》中提出可以通过SWOT分析法分析两种侦察方式在战场上应用的优劣,从而实现联合侦察。由于该方法需要执行的动作只有两种,所以分析结果可以直接执行。但是对于复杂高维的多智能体无人对抗系统来说,应当选取哪些指标进行有效分析以及分析结果如何和复杂的动作空间对接是两个重要的问题。
[0005]3、多智能体自主对抗任务涉及到目标识别、自主定位、打击跟踪、任务规划、目标位姿规划、路径规划、打击目标规划、车辆行驶姿态规划、底盘控制和云台控制等众多功能模块,输入状态数据常常是高维、多模态的。大多基于逻辑判断的方法没有综合地分析各种观测数据信息进行决策,而基于优化的方法面对复杂的状态数据结构和任务需求难以建模求解。系统整体的状态空间和动作空间非常复杂,在实际机器人上即时决策任务对于实时性要求较高,不可能直接集中式生成最优决策方案。

技术实现思路

[0006]本专利技术要解决的技术问题在于:针对现有技术存在的问题,提出一种基于SWOT分析和行为树的多智能体无人对抗系统的决策方法,该方法为一种易实现、易调试、易扩展且灵活性强的多智能体地面无人对抗系统分布式自主决策方法。
[0007]为解决上述技术问题,本专利技术提出的技术方案为:
[0008]一种基于SWOT分析和行为树的多智能体无人对抗系统的决策方法,步骤包括:
[0009]步骤1:搭建分布式通信网络,并根据所搭建的分布式通信网络实时获取通信数据,通信数据包括同队多智能体间的交互状态数据、对抗系统状态信息以及观测获得的敌方状态数据;同队多智能体间的交互状态数据中包括规划状态结果数据;
[0010]步骤2:搭建分布式状态黑板,将步骤1中实时获取的通信数据输入到所搭建的分布式状态黑板中;
[0011]步骤3:构建行为树,构建行为树的具体方法为:通过基于xml的可视化行为树编辑器自动生成json文件,并对所生成的json文件进行解析,完成行为树的构建;
[0012]步骤4:构建SWOT态势分析模块,所构建的SWOT态势分析模块中包括形势评价函数和战力评价函数,其中,形势评价函数用于衡量输赢趋势,战力评价函数用于衡量战斗能力;
[0013]步骤5:对步骤1中实时获取的通信数据进行处理,得到通信数据处理结果,并将得到的通信数据处理结果输入到步骤2中写有通信数据的分布式状态黑板中,通信数据处理结果包括通用代价地图集和每个智能体的战力值;
[0014]步骤6:使用步骤5中分布式状态黑板中对抗系统状态信息执行步骤3构建的行为树;
[0015]步骤7:使用步骤4中所构建的SWOT态势分析模块中的形势评价函数和战力评价函数将当前对抗态势分类为ST、SO、WT、WO四种状态,并将当前对抗态势分类输入到分布式状态黑板上作为态势状态数据值,并根据对抗态势分类选择行为树中的动作节点;
[0016]步骤8:根据步骤7中所选择的行为树中的动作节点,计算智能体运动目标位置的决策方案,计算方法具体为:根据步骤5中通用代价地图集和步骤7选择的动作节点类型,为各层代价地图分配对应动作的权重系数,将各层代价地图进行加权求和后获得对应的动作的目标位置代价地图,通过启发式搜索算法搜索代价最小的网格点并进行坐标系转化,获得该智能体运动目标位置的决策方案;
[0017]步骤9:根据步骤7中所选择的行为树中的动作节点,计算动作节点中的打击目标、运行姿态和目标姿态角决策方案,计算的具体方法为:
[0018](1)根据距离指标和步骤5中每个智能体的战力值,构建攻击目标代价函数,并根据构建的攻击目标代价函数计算满足一致性条件的目标攻击对象的id;
[0019](2)构建车辆姿态决策行为树,并根据构建的车辆姿态决策行为树计算不同动作类型下车辆的运行姿态决策方案;
[0020](3)根据步骤5中的敌方状态数据,计算车辆云台姿态角决策方案;
[0021]步骤10:将步骤8中的决策方案发送给规划器,将步骤9中的决策方案发送给规划器或控制器;规划器和控制器保证底层执行器能够执行决策指令,规划器尝试完成规划任务后,通过步骤1的通信网络传输规划状态结果数据,并更新步骤5中分布式黑板中的规划状态结果数据;
[0022]所述的步骤8和步骤9中的决策结果指步骤8中的智能体的目标运动位置决策方案和步骤9中的打击目标、运行姿态和目标姿态角决策方案。
[0023]所述的步骤5中,对步骤1中实时获取的通信数据进行处理获取通用代价地图集的方法为:
[0024](1)通过广度优先算法一次性遍历智能体视场范围内的网格地图,同时生成多张
需要的指标代价地图,具体包括包含障碍物信息的距离代价地图、和队友之间距离代价地图、敌人距离代价地图、射击代价地图、队内集中程度、敌人集中程度、相对敌人朝向代价、包围敌方夹角、占有度代价、可达性等指标代价;
[0025](2)对每张地图进行归一化处理;
[0026](3)将所有代价地图打包后更新分布式状态黑板的通用代价地图集,更新步骤2中所搭建的分布式状态黑板中对应的通用代价地图矩集。
[0027]本专利技术具有如下有益效果:
[0028](1)本专利技术使用SWOT态势分析法帮助行为树选择行为类型,直观展示当前对抗形势,可解释性强,生成的决策方案具有一定的自适应性和灵活性,解决了传统行为树完全依赖人为逻辑分析,容易造成动作条件选择不合理、甚至条件遗漏等问题。通过巧妙设计并利用行为树的可执行性弥补了SWOT分析结果过于粗糙难以操作问题。
[0029](2)本专利技术使用分布本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于SWOT分析和行为树的多智能体无人对抗系统的决策方法,其特征在于步骤包括:步骤1:搭建分布式通信网络,并根据所搭建的分布式通信网络实时获取通信数据;步骤2:搭建分布式状态黑板,并将步骤1中实时获取的通信数据输入到所搭建的分布式状态黑板中;步骤3:构建行为树;步骤4:构建SWOT态势分析模块;步骤5:将实时获取的通信数据的处理结果更新步骤2中的分布式状态黑板中;步骤6:执行步骤3构建的行为树;步骤7:使用步骤4中所构建的SWOT态势分析模块将当前对抗态势进行分类,并将当前对抗态势分类结果更新至分布式状态黑板上,并根据对抗态势分类结果选择行为树中的动作节点;步骤8:根据步骤7中所选择的行为树中的动作节点,计算智能体运动目标位置的决策方案;步骤9:根据步骤7中所选择的行为树中的动作节点,计算动作节点中的打击目标、运行姿态和目标姿态角决策方案;步骤10:将步骤8中的决策方案和步骤9中的决策方案发送到底层控制器和规划器并更新分布式状态黑板,完成基于SWOT分析和行为树的多智能体无人对抗系统的决策。2.根据权利要求1所述的一种基于SWOT分析和行为树的多智能体无人对抗系统的决策方法,其特征在于:所述的步骤1中,通信数据包括同队多智能体间的交互状态数据、对抗系统状态信息以及观测获得的敌方状态数据;同队多智能体间的交互状态数据中包括规划状态结果数据。3.根据权利要求1或2所述的一种基于SWOT分析和行为树的多智能体无人对抗系统的决策方法,其特征在于:所述的步骤3中,构建行为树的具体方法为:通过基于xml的可视化行为树编辑器自动生成json文件,并对所生成的json文件进行解析,完成行为树的构建。4.根据权利要求3所述的一种基于SWOT分析和行为树的多智能体无人对抗系统的决策方法,其特征在于:所述的步骤4中,所构建的SWOT态势分析模块中包括形势评价函数和战力评价函数,其中,形势评价函数用于衡量输赢趋势,战力评价函数用于衡量战斗能力。5.根据权利要求4所述的一种基于SWOT分析和行为树的多智能体无人对抗系统的决策方法,其特征在于:所述的步骤5中,通信数据处理结果包括通用代...

【专利技术属性】
技术研发人员:邓方周轩孙智昊郑豪张乐乐陈杰
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1