一种智能体决策方法及装置制造方法及图纸

技术编号：37787561 阅读：24 留言：0更新日期：2023-06-09 09:17

本发明专利技术公开了一种智能体决策方法及装置，该方法包括：构建智能体决策模型；获取环境态势信息；基于智能体决策模型对环境态势信息进行处理，确定出智能体决策结果；智能体决策结果用于指示智能体的战术动作执行。可见，本发明专利技术有利于提升决策灵活度，进而提高智能体战术策略探索能力。策略探索能力。策略探索能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种智能体决策方法及装置

[0001]本专利技术涉及计算机
，尤其涉及一种智能体决策方法及装置。

技术介绍

[0002]在仿真系统中，虚拟战场存在战争迷雾，智能体需要考虑诸多因素：地形、气象等外部环境因素，自身的武器装备和战术策略信息，敌方及友邻的动态信息等等，同时作战单元行动空间很大，智能体很难把握战场态势，制定出科学合理的战术策略。传统的基于知识规则驱动的方法需要花费大量资源来维护，不够灵活。因此，提供一种智能体决策方法及装置，以提升决策灵活度，进而提高智能体战术策略探索能力。

技术实现思路

[0003]本专利技术所要解决的技术问题在于，提供一种智能体决策方法及装置有利于提升决策灵活度，进而提高智能体战术策略探索能力。
[0004]为了解决上述技术问题，本专利技术实施例第一方面公开了一种智能体决策方法，所述方法包括：
[0005]构建智能体决策模型；
[0006]获取环境态势信息；
[0007]基于所述智能体决策模型对所述环境态势信息进行处理，确定出智能体决策结果；所...

【技术保护点】

【技术特征摘要】
1.一种智能体决策方法，其特征在于，所述方法包括：构建智能体决策模型；获取环境态势信息；基于所述智能体决策模型对所述环境态势信息进行处理，确定出智能体决策结果；所述智能体决策结果用于指示智能体的战术动作执行。2.根据权利要求1所述的智能体决策方法，其特征在于，所述构建智能体决策模型，包括：获取决策任务；对所述决策任务进行分解，得到子任务集；所述子任务集包括至少2个子任务；基于所述子任务集中各所述子任务的任务关系构建行为树；所述行为树包括若干个树节点；每个所述树节点对应于一个所述子任务；基于预设的决策模型集合对所述行为树中各所述树节点进行模型设定，得到智能体决策模型；所述智能体决策模型包括若干个节点模型；每个所述树节点对应于至少1个所述节点模型。3.根据权利要求1所述的智能体决策方法，其特征在于，所述基于所述智能体决策模型对所述环境态势信息进行处理，确定出智能体决策结果，包括：从所述智能体决策模型中确定出所述环境态势信息的任务属性信息相匹配的目标模型集合；所述目标模型集合包括至少1个节点模型，至多2个所述节点模型；所述节点模型包括智能决策模型，和/或，逻辑决策模型；判断所述目标模型集合中的所有所述节点模型是否存在所述智能决策模型，得到第一模型判断结果；当所述第一模型判断结果为是时，判断所述任务属性信息对应的模型优先级是否与所述智能决策模型的模型优先级相一致，得到第二模型判断结果；当所述第二模型判断结果为是时，基于所述智能决策模型对所述环境态势信息进行处理，得到智能体决策结果；当所述第二模型判断结果为否时，基于所述逻辑决策模型对所述环境态势信息进行处理，得到所述智能体决策结果；当所述第一模型判断结果为否时，基于所述逻辑决策模型对所述环境态势信息进行处理，得到所述智能体决策结果。4.根据权利要求3所述的智能体决策方法，其特征在于，所述基于所述智能决策模型对所述环境态势信息进行处理，得到智能体决策结果，包括：对所述环境态势信息进行结构化处理，得到状态空间信息；所述状态空间信息为多维张量结构的数据信息；利用所述智能决策模型中的第一策略模型对所述状态空间信息进行处理，得到智能体决策结果。5.根据权利要求4所述的智能体决策方法，其特征在于，所述智能体决策结果包括动作类型和动作参数；所述第一策略模型包括第一模型、第二模型和第三模型；所述第二模型和所述第三模型并行连接于所述第一模型；
所述利用所述智能决策模型中的第一策略模型对所述状态空间信息进行处理，得到智能体决策结果，包括：利用所述第一模型中的卷积层对所述状态空间信息进行2次卷积处理，得到卷积信息；利用所述第一模型中的池化层对所述卷积信息进行空间金字塔池化操作，得到池化信息；利用所述第一模型中的输出层对所述池化信息进行全连接处理，得到状态参...

【专利技术属性】
技术研发人员：张俊峰，张扬，陈企华，周鹏，张煜，淦家杭，张焕俊，王常琳，张媛媛，李文哲，高超，田原，
申请(专利权)人：中国人民解放军三二三七零部队，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人