【技术实现步骤摘要】
本申请涉及数据分析领域,尤其涉及一种基于深度强化学习智能体推演数据的知识抽取方法。
技术介绍
1、随着智能游戏技术的不断发展,飞行器类空战游戏已经越来越多的出现游戏智能体完胜玩家的场面,为了提高人机对抗的吸引力,迫切需要提供一种能提高游戏玩家对战水平的辅助方法。
2、目前,最具有代表性的实际方案主要有两种:一种是基于规则的方法,它主要是通过总结目前游戏中各类空中交战战法,形成策略规则,利用规则来推演每次的对抗游戏,帮助玩家提高对抗水平。这种方法不能描述复杂多变的游戏空战场景,培训效率低,效果较差;第二种方法是利用智能体进行对战模拟训练,然后输出数据供玩家学习以提高战术水平。虽然该方法能够适应复杂的对抗场景,且随着智能体技术的成熟,智能体获胜率不断提高,其输出的数据极具学习参考价值,但直接利用智能体输出数据来提升玩家的水平并不是很容易的事。首先,智能体的每步输出是飞机的基础操作量即飞机摇杆、油门和方向舵控制量,不是直接所采取的战术动作;其次,智能体没有提供对作战状态的高度抽象,使分析战术所对应的状态湮灭在连续变化的对战过程中,
...【技术保护点】
1.一种基于深度强化学习智能体推演数据的知识抽取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于深度强化学习智能体推演数据的知识抽取方法,其特征在于:
3.根据权利要求1所述的基于深度强化学习智能体推演数据的知识抽取方法,其特征在于,所述战术动作数据包括:径向过载nx、法向过载nz、滚转角μ。
4.根据权利要求1所述的基于深度强化学习智能体推演数据的知识抽取方法,其特征在于,所述态势状态数据包括:飞行方向、位置、距离、高度差、速度。
5.根据权利要求3所述的基于深度强化学习智能体推演数据的知识抽取方法,其特
...【技术特征摘要】
1.一种基于深度强化学习智能体推演数据的知识抽取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于深度强化学习智能体推演数据的知识抽取方法,其特征在于:
3.根据权利要求1所述的基于深度强化学习智能体推演数据的知识抽取方法,其特征在于,所述战术动作数据包括:径向过载nx、法向过载nz、滚转角μ。
4.根据权利要求1所述的基于深度强化学习智能体推演数据的知识抽取方法,其特征在于,所述态势状态数据包括:飞行方向、位置、距离、高度差、速度。
5.根据权利要求3所述的基于深度强化学习智能体推演数据的知识抽取方法,其特征在于,所述战术动作类型包括:匀速前飞、加速前飞、减速前飞、匀速左转、加速左转、减速左转、匀速右转、加速右转、减速右转、匀速下降、...
【专利技术属性】
技术研发人员:李唯,赵海阔,彭鹏,张宁远,
申请(专利权)人:白杨未来北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。