人机对抗行动预测方法、装置、电子设备和存储介质制造方法及图纸

技术编号：28038674 阅读：16 留言：0更新日期：2021-04-09 23:21

本发明专利技术提供一种人机对抗行动预测方法、装置、电子设备和存储介质，其中方法包括:基于人机对抗环境信息，构建对抗空间，并建模得到对抗空间模型；对所述对抗空间模型进行分析和推理，构建态势认知模型；基于所述态势认知模型进行宏观决策，生成宏观策略规划，并将所述宏观策略规划分解为每个行动单元的微操行为；基于每个行动单元的微操行为和所述态势认知模型，针对每个行动单元进行目标选择、路径生成、时间规划和底层动作生成，得到各行动单元的行动序列。本发明专利技术提高了智能体的人机对抗能力。

全部详细技术资料下载

【技术实现步骤摘要】
人机对抗行动预测方法、装置、电子设备和存储介质
本专利技术涉及人机对抗
，尤其涉及一种人机对抗行动预测方法、装置、电子设备和存储介质。
技术介绍
人机对抗作为人工智能研究的前沿方向，已成为国内外智能决策领域研究的热点，并为探寻机器智能的内在生长机制和关键技术的验证提供有效试验环境和途径。基于人类现有的知识和智能水平，通过研究和实现新型的智能学习算法，使得机器智能在可控的范围内不断接近、达到甚至超过人类的智能水平。整个过程不仅能够让机器更加智能地为人类服务，而且人类也能够借鉴机器智能的发展过程，提升自身的智能水平，进而推动整个社会由信息化向智能化发展。然而，巨复杂、高动态、不确定的强对抗环境给智能认知和决策带来巨大挑战，人类的感知和决策能力由于受自身生理和心理方面的限制，面对复杂、动态、对抗环境下智能认知与决策需求，迫切需要以机器为载体的人工智能技术的辅助与支撑。人工智能技术的发展通常可分为计算智能、感知智能和认知智能三个阶段。传统的人工智能以强大的计算能力为主要特征，其特点是快速计算和记忆存储能力大幅超越人类。近年来，以机器学习为代表的人工智能技术得到了飞速发展，使得机器获取、处理和分析信息的水平得到了大幅提升。感知智能算法在语音处理、图像识别、文本翻译等诸多问题中都已经达到甚至局部超过人类的感知能力。在认知决策领域，虽然计算机目前才刚刚起步，还未达到人类水平，但是认知智能的应用前景广阔，影响深远，因此认知智能的相关研究如火如荼。近几年来，以AlphaGo、冷扑大师等为代表的智能博弈算法在边界确定、规则...

【技术保护点】
1.一种人机对抗行动预测方法，其特征在于，包括：/n基于人机对抗环境信息，构建对抗空间，并建模得到对抗空间模型；所述对抗空间包括状态空间和动作空间；所述状态空间包括我方状态表示、敌方状态表示以及环境状态表示；所述动作空间为多层级行为空间，其中上一层行为空间中的行为由下一层行为空间中的多个行为组合而成；/n对所述对抗空间模型进行分析和推理，构建态势认知模型；所述态势认知模型包括：基本态势表示、全局态势表示和局部态势表示；所述基本态势表示包括我方基本态势、敌方基本态势和环境基本态势；所述全局态势表示包括全局威胁评估结果、全局赢面分析结果和全局意图识别结果；所述局部态势表示包括局部威胁评估结果、局部赢面分析结果和局部意图识别结果；/n基于所述态势认知模型进行宏观决策，生成宏观策略规划，并将所述宏观策略规划分解为每个行动单元的微操行为；/n基于每个行动单元的微操行为和所述态势认知模型，针对每个行动单元进行目标选择、路径生成、时间规划和底层动作生成，得到各行动单元的行动序列。/n

【技术特征摘要】
1.一种人机对抗行动预测方法，其特征在于，包括：
基于人机对抗环境信息，构建对抗空间，并建模得到对抗空间模型；所述对抗空间包括状态空间和动作空间；所述状态空间包括我方状态表示、敌方状态表示以及环境状态表示；所述动作空间为多层级行为空间，其中上一层行为空间中的行为由下一层行为空间中的多个行为组合而成；
对所述对抗空间模型进行分析和推理，构建态势认知模型；所述态势认知模型包括：基本态势表示、全局态势表示和局部态势表示；所述基本态势表示包括我方基本态势、敌方基本态势和环境基本态势；所述全局态势表示包括全局威胁评估结果、全局赢面分析结果和全局意图识别结果；所述局部态势表示包括局部威胁评估结果、局部赢面分析结果和局部意图识别结果；
基于所述态势认知模型进行宏观决策，生成宏观策略规划，并将所述宏观策略规划分解为每个行动单元的微操行为；
基于每个行动单元的微操行为和所述态势认知模型，针对每个行动单元进行目标选择、路径生成、时间规划和底层动作生成，得到各行动单元的行动序列。

2.根据权利要求1所述的人机对抗行动预测方法，其特征在于，所述动作空间包括原子行为、微操行为、协同行为以及策略行为；
所述微操行为由所述原子行为组合而成；
所述协同行为由所述微操行为组合而成；
所述策略行为由所述协同行为组合而成。

3.根据权利要求1所述的人机对抗行动预测方法，其特征在于，所述人机对抗环境信息包括实时盘面观察信息和初始地图信息。

4.根据权利要求1至3任一项所述的人机对抗行动预测方法，其特征在于，所述状态空间是基于如下步骤确定的：
基于我方行动单元的属性信息、我方分数信息和我方占地信息，构建我方状态表示；
基于敌方行动单元的属性信息、敌方分数信息和敌方占地信息，构建敌方状态表示；
基于地图属性信息、地图规则信息和推演反馈信息，构建环境状态表示。

5.根据权利要求1至3任一项所述的人机对抗行动预测方法，其特征在于，所述基本态势表示是基于如下步骤确定的：
基于我方行动单元的状态变化信息、我方行动单元的当前可执行行为信息和我方得失信息，构建我方基本态势；
基于敌方行动单元的状态变化信息、敌方行动单元的当前可执行行为信息和敌方得失信息，构建敌方基本态势；
基于关键地形信息、对抗时空信息和对抗裁决信息，构建环境基本态势。

6.根据权利要求1至3任一项...

【专利技术属性】
技术研发人员：黄凯奇，赵美静，尹奇跃，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人