基于深度强化学习智能体推演数据的知识抽取方法技术

技术编号:42823211 阅读:19 留言:0更新日期:2024-09-24 21:00
本发明专利技术涉及一种基于深度强化学习智能体推演数据的知识抽取方法,包括获取智能体状态数据和对应的智能体动作数据,计算战术动作数据,将所述战术动作数据划分为多个动作区间,认定区间的标准战术动作类型,根据每个动作区间内第一时刻状态数据计算态势状态数据和态势状态类型,输出所述态势状态和所述战术动作的数据和类型。通过本发明专利技术,能够将智能体的输出数据转化为便于玩家理解的信息,从而有效提升玩家对抗战术的学习效率,且能够使用各种深度强化学习方法,具备良好的可扩展性。

【技术实现步骤摘要】

本申请涉及数据分析领域,尤其涉及一种基于深度强化学习智能体推演数据的知识抽取方法


技术介绍

1、随着智能游戏技术的不断发展,飞行器类空战游戏已经越来越多的出现游戏智能体完胜玩家的场面,为了提高人机对抗的吸引力,迫切需要提供一种能提高游戏玩家对战水平的辅助方法。

2、目前,最具有代表性的实际方案主要有两种:一种是基于规则的方法,它主要是通过总结目前游戏中各类空中交战战法,形成策略规则,利用规则来推演每次的对抗游戏,帮助玩家提高对抗水平。这种方法不能描述复杂多变的游戏空战场景,培训效率低,效果较差;第二种方法是利用智能体进行对战模拟训练,然后输出数据供玩家学习以提高战术水平。虽然该方法能够适应复杂的对抗场景,且随着智能体技术的成熟,智能体获胜率不断提高,其输出的数据极具学习参考价值,但直接利用智能体输出数据来提升玩家的水平并不是很容易的事。首先,智能体的每步输出是飞机的基础操作量即飞机摇杆、油门和方向舵控制量,不是直接所采取的战术动作;其次,智能体没有提供对作战状态的高度抽象,使分析战术所对应的状态湮灭在连续变化的对战过程中,因此很难使玩家理解。本文档来自技高网...

【技术保护点】

1.一种基于深度强化学习智能体推演数据的知识抽取方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于深度强化学习智能体推演数据的知识抽取方法,其特征在于:

3.根据权利要求1所述的基于深度强化学习智能体推演数据的知识抽取方法,其特征在于,所述战术动作数据包括:径向过载nx、法向过载nz、滚转角μ。

4.根据权利要求1所述的基于深度强化学习智能体推演数据的知识抽取方法,其特征在于,所述态势状态数据包括:飞行方向、位置、距离、高度差、速度。

5.根据权利要求3所述的基于深度强化学习智能体推演数据的知识抽取方法,其特征在于,所述战术动作...

【技术特征摘要】

1.一种基于深度强化学习智能体推演数据的知识抽取方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于深度强化学习智能体推演数据的知识抽取方法,其特征在于:

3.根据权利要求1所述的基于深度强化学习智能体推演数据的知识抽取方法,其特征在于,所述战术动作数据包括:径向过载nx、法向过载nz、滚转角μ。

4.根据权利要求1所述的基于深度强化学习智能体推演数据的知识抽取方法,其特征在于,所述态势状态数据包括:飞行方向、位置、距离、高度差、速度。

5.根据权利要求3所述的基于深度强化学习智能体推演数据的知识抽取方法,其特征在于,所述战术动作类型包括:匀速前飞、加速前飞、减速前飞、匀速左转、加速左转、减速左转、匀速右转、加速右转、减速右转、匀速下降、...

【专利技术属性】
技术研发人员:李唯赵海阔彭鹏张宁远
申请(专利权)人:白杨未来北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1