人机对抗行动预测方法、装置、电子设备和存储介质制造方法及图纸

技术编号:28038674 阅读:16 留言:0更新日期:2021-04-09 23:21
本发明专利技术提供一种人机对抗行动预测方法、装置、电子设备和存储介质,其中方法包括:基于人机对抗环境信息,构建对抗空间,并建模得到对抗空间模型;对所述对抗空间模型进行分析和推理,构建态势认知模型;基于所述态势认知模型进行宏观决策,生成宏观策略规划,并将所述宏观策略规划分解为每个行动单元的微操行为;基于每个行动单元的微操行为和所述态势认知模型,针对每个行动单元进行目标选择、路径生成、时间规划和底层动作生成,得到各行动单元的行动序列。本发明专利技术提高了智能体的人机对抗能力。

【技术实现步骤摘要】
人机对抗行动预测方法、装置、电子设备和存储介质
本专利技术涉及人机对抗
,尤其涉及一种人机对抗行动预测方法、装置、电子设备和存储介质。
技术介绍
人机对抗作为人工智能研究的前沿方向,已成为国内外智能决策领域研究的热点,并为探寻机器智能的内在生长机制和关键技术的验证提供有效试验环境和途径。基于人类现有的知识和智能水平,通过研究和实现新型的智能学习算法,使得机器智能在可控的范围内不断接近、达到甚至超过人类的智能水平。整个过程不仅能够让机器更加智能地为人类服务,而且人类也能够借鉴机器智能的发展过程,提升自身的智能水平,进而推动整个社会由信息化向智能化发展。然而,巨复杂、高动态、不确定的强对抗环境给智能认知和决策带来巨大挑战,人类的感知和决策能力由于受自身生理和心理方面的限制,面对复杂、动态、对抗环境下智能认知与决策需求,迫切需要以机器为载体的人工智能技术的辅助与支撑。人工智能技术的发展通常可分为计算智能、感知智能和认知智能三个阶段。传统的人工智能以强大的计算能力为主要特征,其特点是快速计算和记忆存储能力大幅超越人类。近年来,以机器学习为代表的人工智能技术得到了飞速发展,使得机器获取、处理和分析信息的水平得到了大幅提升。感知智能算法在语音处理、图像识别、文本翻译等诸多问题中都已经达到甚至局部超过人类的感知能力。在认知决策领域,虽然计算机目前才刚刚起步,还未达到人类水平,但是认知智能的应用前景广阔,影响深远,因此认知智能的相关研究如火如荼。近几年来,以AlphaGo、冷扑大师等为代表的智能博弈算法在边界确定、规则固定的人机对抗问题中已经战胜了人类顶级专业选手,为人工智能技术由感知智能向认知智能跨越式发展带来了新的曙光。虽然人机对抗智能技术获得极大的关注,并在不同应用领域展现出其应用前景,但可建模、可计算以及可解释的人机对抗智能决策过程,还没有系统性的技术方案。因此,亟需一种系统性的人机对抗智能决策方法,实现智能体对抗行动的准确预测。
技术实现思路
本专利技术提供一种人机对抗行动预测方法、装置、电子设备和存储介质,实现智能体对抗行动的准确预测,提高智能体的对抗能力。本专利技术提供一种人机对抗行动预测方法,包括:基于人机对抗环境信息,构建对抗空间,并建模得到对抗空间模型;所述对抗空间包括状态空间和动作空间;所述状态空间包括我方状态表示、敌方状态表示以及环境状态表示;所述动作空间为多层级行为空间,其中上一层行为空间中的行为由下一层行为空间中的多个行为组合而成;对所述对抗空间模型进行分析和推理,构建态势认知模型;所述态势认知模型包括:基本态势表示、全局态势表示和局部态势表示;所述基本态势表示包括我方基本态势、敌方基本态势和环境基本态势;所述全局态势表示包括全局威胁评估结果、全局赢面分析结果和全局意图识别结果;所述局部态势表示包括局部威胁评估结果、局部赢面分析结果和局部意图识别结果;基于所述态势认知模型进行宏观决策,生成宏观策略规划,并将所述宏观策略规划分解为每个行动单元的微操行为;基于每个行动单元的微操行为和所述态势认知模型,针对每个行动单元进行目标选择、路径生成、时间规划和底层动作生成,得到各行动单元的行动序列。根据本专利技术提供的一种人机对抗行动预测方法,所述动作空间包括原子行为、微操行为、协同行为以及策略行为;所述微操行为由所述原子行为组合而成;所述协同行为由所述微操行为组合而成;所述策略行为由所述协同行为组合而成。根据本专利技术提供的一种人机对抗行动预测方法,所述人机对抗环境信息包括实时盘面观察信息和初始地图信息。根据本专利技术提供的一种人机对抗行动预测方法,所述状态空间是基于如下步骤确定的:基于我方行动单元的属性信息、我方分数信息和我方占地信息,构建我方状态表示;基于敌方行动单元的属性信息、敌方分数信息和敌方占地信息,构建敌方状态表示;基于地图属性信息、地图规则信息和推演反馈信息,构建环境状态表示。根据本专利技术提供的一种人机对抗行动预测方法,所述基本态势表示是基于如下步骤确定的:基于我方行动单元的状态变化信息、我方行动单元的当前可执行行为信息和我方得失信息,构建我方基本态势;基于敌方行动单元的状态变化信息、敌方行动单元的当前可执行行为信息和敌方得失信息,构建敌方基本态势;基于关键地形信息、对抗时空信息和对抗裁决信息,构建环境基本态势。根据本专利技术提供的一种人机对抗行动预测方法,所述全局态势表示是基于如下步骤确定的:对我方在当前态势下面临的来自敌方的整体威胁程度进行评估,得到所述全局威胁评估结果;对我方在当前态势下进行对抗的赢面概率进行预测,得到所述全局赢面分析结果;对敌方在当前态势下采取的对抗策略进行预测,得到所述全局意图识别结果。根据本专利技术提供的一种人机对抗行动预测方法,所述局部态势表示是基于如下步骤确定的:对我方各个行动单元在当前态势下面临的来自敌方的威胁程度进行评估,得到所述局部威胁评估结果;对我方各个行动单元在当前态势下进行对抗的赢面概率进行预测,得到所述局部赢面分析结果;对敌方各个行动单元在当前态势下采取的对抗行为进行预测,得到所述局部意图识别结果。本专利技术还提供一种人机对抗行动预测装置,包括:对抗空间表示建模单元,用于基于人机对抗环境信息,构建对抗空间,并建模得到对抗空间模型;所述对抗空间包括状态空间和动作空间;所述状态空间包括我方状态表示、敌方状态表示以及环境状态表示;所述动作空间为多层级行为空间,其中上一层行为空间中的行为由下一层行为空间中的多个行为组合而成;态势评估推理单元,用于对所述对抗空间模型进行分析和推理,构建态势认知模型;所述态势认知模型包括:基本态势表示、全局态势表示和局部态势表示;所述基本态势表示包括我方基本态势、敌方基本态势和环境基本态势;所述全局态势表示包括全局威胁评估结果、全局赢面分析结果和全局意图识别结果;所述局部态势表示包括局部威胁评估结果、局部赢面分析结果和局部意图识别结果;决策生成优化单元,用于基于所述态势认知模型进行宏观决策,生成宏观策略规划,并将所述宏观策略规划分解为每个行动单元的微操行为;行动协同控制单元,用于基于每个行动单元的微操行为和所述态势认知模型,针对每个行动单元进行目标选择、路径生成、时间规划和底层动作生成,得到各行动单元的行动序列。本专利技术还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述人机对抗行动预测方法的步骤。本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述人机对抗行动预测方法的步骤。本专利技术提供的人机对抗行动预测方法、装置、电子设备和存储介质,基于人机对抗环境信息,构建对抗空间,并建模得到对抗空间模型,对对抗空间模型进行分析和推理,构建态势认知模型,基于态势本文档来自技高网
...

【技术保护点】
1.一种人机对抗行动预测方法,其特征在于,包括:/n基于人机对抗环境信息,构建对抗空间,并建模得到对抗空间模型;所述对抗空间包括状态空间和动作空间;所述状态空间包括我方状态表示、敌方状态表示以及环境状态表示;所述动作空间为多层级行为空间,其中上一层行为空间中的行为由下一层行为空间中的多个行为组合而成;/n对所述对抗空间模型进行分析和推理,构建态势认知模型;所述态势认知模型包括:基本态势表示、全局态势表示和局部态势表示;所述基本态势表示包括我方基本态势、敌方基本态势和环境基本态势;所述全局态势表示包括全局威胁评估结果、全局赢面分析结果和全局意图识别结果;所述局部态势表示包括局部威胁评估结果、局部赢面分析结果和局部意图识别结果;/n基于所述态势认知模型进行宏观决策,生成宏观策略规划,并将所述宏观策略规划分解为每个行动单元的微操行为;/n基于每个行动单元的微操行为和所述态势认知模型,针对每个行动单元进行目标选择、路径生成、时间规划和底层动作生成,得到各行动单元的行动序列。/n

【技术特征摘要】
1.一种人机对抗行动预测方法,其特征在于,包括:
基于人机对抗环境信息,构建对抗空间,并建模得到对抗空间模型;所述对抗空间包括状态空间和动作空间;所述状态空间包括我方状态表示、敌方状态表示以及环境状态表示;所述动作空间为多层级行为空间,其中上一层行为空间中的行为由下一层行为空间中的多个行为组合而成;
对所述对抗空间模型进行分析和推理,构建态势认知模型;所述态势认知模型包括:基本态势表示、全局态势表示和局部态势表示;所述基本态势表示包括我方基本态势、敌方基本态势和环境基本态势;所述全局态势表示包括全局威胁评估结果、全局赢面分析结果和全局意图识别结果;所述局部态势表示包括局部威胁评估结果、局部赢面分析结果和局部意图识别结果;
基于所述态势认知模型进行宏观决策,生成宏观策略规划,并将所述宏观策略规划分解为每个行动单元的微操行为;
基于每个行动单元的微操行为和所述态势认知模型,针对每个行动单元进行目标选择、路径生成、时间规划和底层动作生成,得到各行动单元的行动序列。


2.根据权利要求1所述的人机对抗行动预测方法,其特征在于,所述动作空间包括原子行为、微操行为、协同行为以及策略行为;
所述微操行为由所述原子行为组合而成;
所述协同行为由所述微操行为组合而成;
所述策略行为由所述协同行为组合而成。


3.根据权利要求1所述的人机对抗行动预测方法,其特征在于,所述人机对抗环境信息包括实时盘面观察信息和初始地图信息。


4.根据权利要求1至3任一项所述的人机对抗行动预测方法,其特征在于,所述状态空间是基于如下步骤确定的:
基于我方行动单元的属性信息、我方分数信息和我方占地信息,构建我方状态表示;
基于敌方行动单元的属性信息、敌方分数信息和敌方占地信息,构建敌方状态表示;
基于地图属性信息、地图规则信息和推演反馈信息,构建环境状态表示。


5.根据权利要求1至3任一项所述的人机对抗行动预测方法,其特征在于,所述基本态势表示是基于如下步骤确定的:
基于我方行动单元的状态变化信息、我方行动单元的当前可执行行为信息和我方得失信息,构建我方基本态势;
基于敌方行动单元的状态变化信息、敌方行动单元的当前可执行行为信息和敌方得失信息,构建敌方基本态势;
基于关键地形信息、对抗时空信息和对抗裁决信息,构建环境基本态势。


6.根据权利要求1至3任一项...

【专利技术属性】
技术研发人员:黄凯奇赵美静尹奇跃
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1