一种基于规则分层强化学习的作战任务规划方法技术

技术编号:41365850 阅读:42 留言:0更新日期:2024-05-20 10:13
本发明专利技术公开了一种基于规则分层强化学习的作战任务规划方法,该方法包括以下步骤:将仿真环境中空间进一步加工抽象,形成强化学习平台训练的动作空间,即上层策略,用于做强化学习算法的输入参数;利用人类先验知识和基本军事规则形成专家规则,专家规则是一系列可执行动作的结合,以此作为底层策略,通过决策解析将强化学习平台返回的指挥策略翻译成仿真环境的动作指令,控制智能体行为;利用分层强化学习技术结合底层策略和上层策略,训练仿真环境中的智能体;通过训练好的多个智能体,实现仿真环境下的作战任务规划。本发明专利技术能够在模拟战场环境中对设想的军事活动进行对抗演练,研究作战概念和多兵种配合的作战方案。

【技术实现步骤摘要】

本专利技术涉及人工智能强化学习,尤其涉及一种基于规则分层强化学习的作战任务规划方法


技术介绍

1、随着科技科学技术的飞速发展,如今的武器装备已经大范围的高科技化、信息化,所以实兵演习的成本和代价也越来越高昂,而且人员的安全得不到保障,事故和伤亡容易发生,于是基于计算机仿真的军事训练应运而生,并且显示出了巨大的军事和经济效益。

2、强化学习(reinforcement learning,rl)是机器学习的一种,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。强化学习是人工智能研究领域的一个有无限前景的领域,特别是在军工模拟对抗、推演等场景中展现出强大的发展潜力。

3、在强化学习当中,涉及到以下概念:

4、奖励:智能体与环境交互时,每做出一个动作后,环境给予的反馈。在该场景中,反馈可以是根据战术规则制定的a方(或b方)加分或减分的分数。比如己方智能体攻击并消灭了某个b方智能体,则加10分。

5、特征工程:在机器学习或者统计学中,又称为变量选择、属性选择或者本文档来自技高网...

【技术保护点】

1.一种基于规则分层强化学习的作战任务规划方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的基于规则分层强化学习的作战任务规划方法,其特征在于,该方法中的强化学习平台的实现方法为:

3.根据权利要求2所述的基于规则分层强化学习的作战任务规划方法,其特征在于,该方法中强化学习平台训练的方法包括:

4.根据权利要求1所述的基于规则分层强化学习的作战任务规划方法,其特征在于,该方法中的专家规则具体为:

5.根据权利要求1所述的基于规则分层强化学习的作战任务规划方法,其特征在于,该方法中的上层策略具体为:

<p>6.根据权利要求...

【技术特征摘要】

1.一种基于规则分层强化学习的作战任务规划方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的基于规则分层强化学习的作战任务规划方法,其特征在于,该方法中的强化学习平台的实现方法为:

3.根据权利要求2所述的基于规则分层强化学习的作战任务规划方法,其特征在于,该方法中强化学习平台训练的方法包括:

4.根据权利要求1所述的基于规则分层强化学习的作战任务规划...

【专利技术属性】
技术研发人员:罗威代涛龚俊斌黄骁朱春佳
申请(专利权)人:中国舰船研究设计中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1