【技术实现步骤摘要】
本专利技术涉及人工智能强化学习,尤其涉及一种基于规则分层强化学习的作战任务规划方法。
技术介绍
1、随着科技科学技术的飞速发展,如今的武器装备已经大范围的高科技化、信息化,所以实兵演习的成本和代价也越来越高昂,而且人员的安全得不到保障,事故和伤亡容易发生,于是基于计算机仿真的军事训练应运而生,并且显示出了巨大的军事和经济效益。
2、强化学习(reinforcement learning,rl)是机器学习的一种,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。强化学习是人工智能研究领域的一个有无限前景的领域,特别是在军工模拟对抗、推演等场景中展现出强大的发展潜力。
3、在强化学习当中,涉及到以下概念:
4、奖励:智能体与环境交互时,每做出一个动作后,环境给予的反馈。在该场景中,反馈可以是根据战术规则制定的a方(或b方)加分或减分的分数。比如己方智能体攻击并消灭了某个b方智能体,则加10分。
5、特征工程:在机器学习或者统计学中,又称为变
...【技术保护点】
1.一种基于规则分层强化学习的作战任务规划方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的基于规则分层强化学习的作战任务规划方法,其特征在于,该方法中的强化学习平台的实现方法为:
3.根据权利要求2所述的基于规则分层强化学习的作战任务规划方法,其特征在于,该方法中强化学习平台训练的方法包括:
4.根据权利要求1所述的基于规则分层强化学习的作战任务规划方法,其特征在于,该方法中的专家规则具体为:
5.根据权利要求1所述的基于规则分层强化学习的作战任务规划方法,其特征在于,该方法中的上层策略具体为:
< ...【技术特征摘要】
1.一种基于规则分层强化学习的作战任务规划方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的基于规则分层强化学习的作战任务规划方法,其特征在于,该方法中的强化学习平台的实现方法为:
3.根据权利要求2所述的基于规则分层强化学习的作战任务规划方法,其特征在于,该方法中强化学习平台训练的方法包括:
4.根据权利要求1所述的基于规则分层强化学习的作战任务规划...
【专利技术属性】
技术研发人员:罗威,代涛,龚俊斌,黄骁,朱春佳,
申请(专利权)人:中国舰船研究设计中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。