基于数据和知识双驱动的可解释博弈对抗方法技术

技术编号:41974324 阅读:32 留言:0更新日期:2024-07-10 16:53
本发明专利技术提供了一种基于数据和知识双驱动的可解释博弈对抗方法,包括:基于经典控制理论绘制阿波罗尼斯圆,明确存在速度误差情况下单个低速追捕无人车是否能够对快速逃逸无人车实现捕获的待优化条件,得到低速追捕无人车次优控制策略;根据次优控制策略,结合Takagi‑Sugeno模糊模型构建基于知识驱动的快速平滑控制逻辑;将基于知识驱动的快速控制逻辑作为输入添加到基于Takagi‑Sugeno模糊推理的Actor‑Critic控制模型,利用低速追捕无人车在训练过程中与环境的交互获得的数据优化Actor‑Critic控制模型,实现两辆低速追捕无人车对快速逃逸无车的协同围捕。应用本发明专利技术的技术方案,以解决传统强化学习方法具有状态动作空间难以遍历、训练速度慢、控制逻辑阶跃不平滑等技术问题。

【技术实现步骤摘要】

本专利技术涉及多智能体博弈对抗,尤其涉及一种基于数据和知识双驱动的可解释博弈对抗方法


技术介绍

1、随着计算机、无人平台、人工智能等技术的飞速发展,无人化智能化成为新趋势,多智能体博弈对抗方法被广泛研究。在现实世界里捕食者必须捕猎或觅食更大或更快的猎物是一种广泛存在的现象,例如狮子围捕羚羊,羚羊的平均奔跑速度为88km/h、而狮子的平均速度为80km/h。因此研究如何控制多个速度较慢的无人车(低速追捕无人车)围捕一个快速逃逸的目标(快速逃逸无人车)具有重要意义,可应用于囚犯拦截、编队控制、无人机干扰对抗、无人艇协同搜救等应用场景。目前的博弈对抗方法一般基于深度强化学习方法,利用深度神经网络存储控制参数、强化学习与环境交互优化控制参数,通过不断地试错学习获得最优围捕策略。深度神经网络具有不可解释、控制参数庞杂等问题,而传统强化学习方法具有状态动作空间难以遍历、训练速度慢等问题。


技术实现思路

1、本专利技术提供了一种基于数据和知识双驱动的可解释博弈对抗方法,能够解决传统强化学习方法具有状态动作空间难以遍历、训本文档来自技高网...

【技术保护点】

1.一种基于数据和知识双驱动的可解释博弈对抗方法,其特征在于,所述基于数据和知识双驱动的可解释博弈对抗方法包括:

2.根据权利要求1所述的基于数据和知识双驱动的可解释博弈对抗方法,其特征在于,所述低速追捕无人车控制策略具体包括:当低速追捕无人车能够捕获快速逃逸无车时按捕获逻辑控制低速追捕无人车;当低速追捕无人车不具备捕获条件时,控制低速追捕无人车尽量靠近快速逃逸无车。

3.根据权利要求2所述的基于数据和知识双驱动的可解释博弈对抗方法,其特征在于,所述低速追捕无人车控制策略的公式为其中,θPi代表低速追捕无人车pi的前进方向,β为低速追捕无人车pi和快速逃逸无人车E...

【技术特征摘要】

1.一种基于数据和知识双驱动的可解释博弈对抗方法,其特征在于,所述基于数据和知识双驱动的可解释博弈对抗方法包括:

2.根据权利要求1所述的基于数据和知识双驱动的可解释博弈对抗方法,其特征在于,所述低速追捕无人车控制策略具体包括:当低速追捕无人车能够捕获快速逃逸无车时按捕获逻辑控制低速追捕无人车;当低速追捕无人车不具备捕获条件时,控制低速追捕无人车尽量靠近快速逃逸无车。

3.根据权利要求2所述的基于数据和知识双驱动的可解释博弈对抗方法,其特征在于,所述低速追捕无人车控制策略的公式为其中,θpi代表低速追捕无人车pi的前进方向,β为低速追捕无人车pi和快速逃逸无人车e0连线与水平线的夹角,为低速追捕无人车pi待计算的相对于低速追捕无人车pi和快速逃逸无人车e0连线前进方向,ζ为常数,α为快速逃逸无人车e的前进方向相对于低速追捕无人车pi和快速逃逸无人车e0连线的角度,αmax为低速追捕无人车能够捕获快速逃逸无人车的边界条件,|e0pi|为快速逃逸无人车e0和低速追捕无人车pi之间的距离,ve为快速逃逸无人车的速度,δt为追逃过程中计算下一时刻运动轨迹的时间增量。

【专利技术属性】
技术研发人员:李嘉科王逍马喆孙科武赵荣利汪勋
申请(专利权)人:航天科工集团智能科技研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1